Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7615134B2 - 液体がんの治療のための組成物および方法 - Google Patents
[go: Go Back, main page]

JP7615134B2 - 液体がんの治療のための組成物および方法 - Google Patents

液体がんの治療のための組成物および方法 Download PDF

Info

Publication number
JP7615134B2
JP7615134B2 JP2022519460A JP2022519460A JP7615134B2 JP 7615134 B2 JP7615134 B2 JP 7615134B2 JP 2022519460 A JP2022519460 A JP 2022519460A JP 2022519460 A JP2022519460 A JP 2022519460A JP 7615134 B2 JP7615134 B2 JP 7615134B2
Authority
JP
Japan
Prior art keywords
tada
cell
protein
domain
deaminase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022519460A
Other languages
English (en)
Other versions
JP2022549916A5 (ja
JP2022549916A (ja
Inventor
ジェイソン マイケル ゲールケ、
アーロン ディー. エドワーズ、
ライアン マーレイ、
ワシーム カシム、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UCL Business Ltd
Original Assignee
UCL Biomedica PLC
UCL Business Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UCL Biomedica PLC, UCL Business Ltd filed Critical UCL Biomedica PLC
Publication of JP2022549916A publication Critical patent/JP2022549916A/ja
Publication of JP2022549916A5 publication Critical patent/JP2022549916A5/ja
Priority to JP2024231478A priority Critical patent/JP2025066723A/ja
Application granted granted Critical
Publication of JP7615134B2 publication Critical patent/JP7615134B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/30Cellular immunotherapy characterised by the recombinant expression of specific molecules in the cells of the immune system
    • A61K40/31Chimeric antigen receptors [CAR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/10Cellular immunotherapy characterised by the cell type used
    • A61K40/11T-cells, e.g. tumour infiltrating lymphocytes [TIL] or regulatory T [Treg] cells; Lymphokine-activated killer [LAK] cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/10Cellular immunotherapy characterised by the cell type used
    • A61K40/13B-cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/10Cellular immunotherapy characterised by the cell type used
    • A61K40/15Natural-killer [NK] cells; Natural-killer T [NKT] cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/10Cellular immunotherapy characterised by the cell type used
    • A61K40/19Dendritic cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/20Cellular immunotherapy characterised by the effect or the function of the cells
    • A61K40/22Immunosuppressive or immunotolerising
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/418Antigens related to induction of tolerance to non-self
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/42Cancer antigens
    • A61K40/4202Receptors, cell surface antigens or cell surface determinants
    • A61K40/4214Receptors for cytokines
    • A61K40/4215Receptors for tumor necrosis factors [TNF], e.g. lymphotoxin receptor [LTR], CD30
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/42Cancer antigens
    • A61K40/4202Receptors, cell surface antigens or cell surface determinants
    • A61K40/4214Receptors for cytokines
    • A61K40/4217Receptors for interleukins [IL]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/42Cancer antigens
    • A61K40/4202Receptors, cell surface antigens or cell surface determinants
    • A61K40/4224Molecules with a "CD" designation not provided for elsewhere
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70596Molecules with a "CD"-designation not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1267Gram-positive bacteria
    • C07K16/1271Micrococcaceae (F); Staphylococcaceae (F), e.g. Staphylococcus (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IG], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K2035/122Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells for inducing tolerance or supression of immune responses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K2035/124Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells the cells being hematopoietic, bone marrow derived or blood cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/80Vaccine for a specifically defined cancer
    • A61K2039/804Blood cells [leukemia, lymphoma]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2121/00Preparations for use in therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K40/00
    • A61K2239/46Indexing codes associated with cellular immunotherapy of group A61K40/00 characterised by the cancer treated
    • A61K2239/48Blood cells, e.g. leukemia or lymphoma
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/50Cellular immunotherapy characterised by the use of allogeneic cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Developmental Biology & Embryology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Mycology (AREA)

Description

関連出願の相互参照
本出願は、2019年9月27日に出願された米国仮出願第62/907,254号の優先権および利益を主張する国際PCT出願であり、その内容全体が、参照によりその全体が本明細書に援用される。
自己免疫療法および同種免疫療法は、腫瘍治療アプローチであり、対象に、キメラ抗原受容体を発現する免疫細胞が投与される。キメラ抗原受容体(CAR)を発現する免疫細胞を生成するために、免疫細胞は、最初に、対象(自己)または治療を受ける対象とは別個のドナー(同種)から採取され、キメラ抗原受容体を発現するように遺伝子修飾(改変)される。得られた細胞は、その細胞表面(例えばCAR T細胞)にキメラ抗原受容体を発現し、対象に投与した場合、キメラ抗原受容体は、腫瘍細胞によって発現されたマーカーに結合する。腫瘍マーカーとのこの相互作用は、CAR-T細胞を活性化し、次いで、細胞が腫瘍細胞を死滅させる。しかし、自己または同種細胞療法が効果的かつ効率的であるためには、T細胞シグナル伝達の阻害などの有意な条件および細胞応答を克服または回避しなければならない。移植片対宿主病およびCAR-T細胞の宿主拒絶は、同種細胞療法に対して、さらなる課題を提供し得る。これらのプロセスに関与する遺伝子を編集することで、CAR-T細胞の機能を増強し、免疫抑制または免疫阻害に対する耐性を増強することができるが、かかる編集を行うための現在の方法は、CAR-T細胞内の大きなゲノム再編成を誘導する可能性があり、それによって、その有効性に悪影響を与える。したがって、免疫細胞(特に、CAR-T細胞)をより正確に修飾(改変)するための技術が非常に必要とされている。この用途は、このニーズおよびその他の重要なニーズを対象とする。
以下に記載されるように、本発明は、遺伝子修飾免疫細胞を特徴とし、遺伝子修飾免疫細胞は、増強された抗腫瘍活性、免疫抑制への耐性、および、宿主CD8+T細胞が移植片を非自己として認識する場合(例えば、移植レシピエントが移植臓器に対する免疫応答を生成する)、移植片対宿主反応もしくは宿主対移植片反応を誘発する低減されたリスク、またはそれらの組み合わせを有する。一実施形態では、移植片対宿主病(GVHD)を有するか、またはそれを発症する傾向がある対象に、機能的なTRACを欠くか、またはそのレベルが低下しているCAR-T細胞が投与される。一実施形態では、宿主対移植片病(HVGD)を有するか、またはそれを発症する傾向がある対象に、機能的なβ2マイクログロブリン(B2M)を欠くか、またはそのレベルが低下しているCAR-T細胞が投与される。また、本発明は、これらの修飾された免疫細胞を産生および使用するための方法も特徴とする。
一態様では、本発明は、2つ以上の免疫細胞を含む組成物を提供し、各免疫細胞は、a)CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする異なるキメラ抗原受容体であって、免疫細胞が、標的とされた抗原の発現を低減または排除する変異を含む、異なるキメラ抗原受容体と、b)TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される免疫原性ポリペプチドの発現を低減または排除する1つ以上の変異と、を含む。一部の実施形態では、免疫細胞のうちの1つは、CD5を標的とするキメラ抗原受容体を含み、別の免疫細胞は、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を含む。一部の実施形態では、組成物は、少なくとも3つの免疫細胞を含み、各々が、異なる抗原を標的とするキメラ抗原受容体を含み、標的とされた抗原は、CD3、CD5、およびCD7である。一部の実施形態では、免疫細胞のうちの1つは、CD7を標的とするキメラ抗原受容体を発現し、別の免疫細胞は、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を発現する。一部の実施形態では、免疫細胞のうちの1つは、CD3を標的とするキメラ抗原受容体を発現し、別の免疫細胞は、CD33およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を発現する。一部の実施形態では、免疫細胞のうちの1つは、CD33を標的とするキメラ抗原受容体を発現し、別の免疫細胞は、CD123を標的とするキメラ抗原受容体を発現する。一部の実施形態では、1つの免疫細胞が、2つ、3つ、4つ、またはそれ以上の異なるキメラ抗原受容体を発現する。一部の実施形態では、キメラ抗原受容体のうちの1つは、CD5を標的とし、別のキメラ抗原受容体は、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、キメラ抗原受容体のうちの1つは、CD7を標的とし、別のキメラ抗原受容体は、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、キメラ抗原受容体のうちの1つは、CD3を標的とし、別のキメラ抗原受容体は、CD33およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、キメラ抗原受容体のうちの1つは、CD33を標的とし、別のキメラ抗原受容体は、CD123を標的とする。
別の態様では、本発明は、少なくとも3つの免疫細胞を含む組成物を提供し、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体は、CD3を標的とし、1つは、CD5を標的とし、および3つ目は、CD7を標的とし、細胞は、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
さらに別の態様では、本発明は、少なくとも2つの免疫細胞を含む組成物を提供し、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体は、CD3を標的とし、別の受容体は、CD7を標的とし、細胞は、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
一態様では、本発明は、少なくとも2つの免疫細胞を含む組成物を提供し、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体は、CD5を標的とし、別の受容体は、CD7を標的とし、細胞は、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
別の態様では、本発明は、少なくとも2つの免疫細胞を含む組成物を提供し、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体は、CD3を標的とし、別の受容体は、CD5を標的とし、細胞は、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
さらに別の態様では、本発明は、少なくとも2つの免疫細胞を含む組成物を提供し、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体は、CD33を標的とし、別の受容体は、CD123を標的とし、細胞は、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
一部の実施形態では、変異は、遺伝子をサイレンシングするか、または遺伝子に終止コドンを導入するCからTまたはAからGの変異である。一部の実施形態では、変異は、未熟終止コドンを導入するか、またはスプライスドナー部位もしくはスプライスアクセプター部位を変化させる。一部の実施形態では、変異は、デアミナーゼドメインを含む塩基エディターによって生成される。一部の実施形態では、デアミナーゼは、シチジンまたはアデノシンデアミナーゼである。一部の実施形態では、塩基エディターは、BE4である。一部の実施形態では、変異は、変異を欠く対応する対照細胞と比較して、コードされたポリペプチドの発現を約50%以上低減する。一部の実施形態では、組成物は、免疫細胞の集団を含む。一部の実施形態では、集団の少なくとも50%は、標的とされた抗原および/または免疫原性ポリペプチドの発現を低減または排除する1つ以上の変異を含む。一部の実施形態では、免疫細胞は、フラトリサイド(fratricide)耐性である。一部の実施形態では、免疫細胞は、増加した抗腫瘍活性を有する。一部の実施形態では、免疫細胞は、検出可能な転座を含まない。一部の実施形態では、免疫細胞は、1%未満のインデル(indel)を含む。一部の実施形態では、免疫細胞は、哺乳動物細胞である。一部の実施形態では、哺乳動物細胞は、ヒト細胞またはげっ歯類細胞である。一部の実施形態では、免疫細胞は、細胞傷害性T細胞、制御性T細胞、Tヘルパー細胞、樹状細胞、B細胞、もしくはNK細胞、またはそれらの前駆細胞である。一部の実施形態では、前駆細胞は、造血幹細胞である。
一態様では、本発明は、薬学的組成物を提供し、有効量の本明細書に提供される組成物のうちのいずれかと、薬学的に許容される賦形剤と、を含む。
別の態様では、本発明は、塩基エディターシステムを提供し、核酸プログラマブル(プログラム可能)DNA結合タンパク質(napDNAbp:nucleic acid programmable DNA binding protein)およびデアミナーゼドメインを含む融合タンパク質と、各々異なる抗原を標的とする少なくとも2つのガイドポリヌクレオチドと、を含み、抗原は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される。一部の実施形態では、1つのガイドポリヌクレオチドは、CD5を標的とし、別のガイドポリヌクレオチドは、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、システムは、3つのガイドポリヌクレオチドを含み、その各々は、抗原CD3、CD5、およびCD7のうちの1つを標的とする。一部の実施形態では、1つのガイドポリヌクレオチドは、CD7を標的とし、別のガイドポリヌクレオチドは、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、1つのガイドポリヌクレオチドは、CD3を標的とし、別のガイドポリヌクレオチドは、CD33およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、1つのガイドポリヌクレオチドは、CD33を標的とし、別のガイドポリヌクレオチドは、CD123を標的とする。
一部の実施形態では、ガイドポリヌクレオチドは、各々、表26から選択される核酸配列を含む。一部の実施形態では、ガイドポリヌクレオチドは、AGCGACUGCAGAAAGAAGAGまたはCAUACCAGCUGAGCCGUCCGから選択される核酸配列を含む。一部の実施形態では、融合タンパク質は、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)および/または1つ以上の核局在化配列(NLS)をさらに含む。一部の実施形態では、napDNAbpは、Cas9、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦポリペプチドまたはその一部を含む。一部の実施形態では、napDNAbpは、Cas12ポリペプチドまたはその断片を含む。一部の実施形態では、napDNAbpは、Cas9ポリペプチドまたはその断片を含む。一部の実施形態では、Cas9は、不活性型(dead)Cas9(dCas9)またはCas9ニッカーゼ(nCas9)である。一部の実施形態では、Cas9は、修飾Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus1 Cas9(St1Cas9)、または修飾Streptococcus pyogenes Cas9(SpCas9)である。一部の実施形態では、Cas9は、改変プロトスペーサー隣接モチーフ(PAM)特異性を含む。一部の実施形態では、改変PAMは、核酸配列5’-NGC-3’に対する特異性を有する。
一部の実施形態では、デアミナーゼドメインは、シチジンまたはアデノシンを脱アミノ化することができる。一部の実施形態では、デアミナーゼドメインは、シチジンまたはアデノシンデアミナーゼドメインである。一部の実施形態では、シチジンデアミナーゼは、APOBECデアミナーゼである。一部の実施形態では、アデノシンデアミナーゼは、TadAバリアントである。一部の実施形態では、TadAバリアントは、TadA*8バリアントである。一部の実施形態では、TadA*8バリアントは、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一部の実施形態では、TadAバリアントは、TadA*9バリアントである。
一態様では、本発明は、本明細書に提供される塩基エディターシステムのいずれかを含む薬学的組成物を提供する。
別の態様では、本発明は、本明細書に提供される塩基エディターシステムおよびガイドポリヌクレオチドのうちのいずれかをコードするポリヌクレオチドを提供する。
さらに別の態様では、本発明は、本明細書に提供されるポリヌクレオチドのうちのいずれかを含むベクターを提供する。一部の実施形態では、ベクターは、ウイルスベクターである。一部の実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。
一態様では、本発明は、本明細書に提供されるポリヌクレオチドまたはベクターのうちのいずれかを含む薬学的組成物を提供する。
一態様では、本発明は、低減された免疫原性を有するCAR発現免疫細胞を産生するための方法を提供する。一部の実施形態では、本方法は、CAR発現免疫細胞で、核酸プログラマブルDNA結合タンパク質(napDNAbp)およびデアミナーゼドメインを含む融合タンパク質と、各々異なる抗原をコードするポリヌクレオチドを標的とする2つのガイドポリヌクレオチドと、を含む塩基エディターシステムを発現させることを含み、抗原は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、それによって、低減された免疫原性を有するCAR発現免疫細胞を産生する。一部の実施形態では、免疫細胞は、ガイドポリヌクレオチドを発現するか、またはそれと接触し、ガイドポリヌクレオチドは、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドをコードするポリヌクレオチドを標的とする。
一部の実施形態では、本方法は、(a)CAR発現免疫細胞で、核酸プログラマブルDNA結合タンパク質(napDNAbp)と、デアミナーゼドメインを含む融合タンパク質と、を含む塩基エディターシステムを発現させることと、(b)CAR発現免疫細胞を、各々異なる抗原をコードするポリヌクレオチドを標的とする少なくとも2つのガイドポリヌクレオチドと接触させることと、を含み、抗原は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、それによって、低減された免疫原性を有するCAR発現免疫細胞を産生する。
一部の実施形態では、本方法は、CAR発現免疫細胞を、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドをコードするポリヌクレオチドを標的とするガイドポリヌクレオチドと接触させることをさらに含む。一部の実施形態では、免疫細胞は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体(CAR)を発現する。一部の実施形態では、本方法は、免疫細胞に、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される少なくとも1つのポリペプチドの発現を低減または排除する変異を導入し、それによって、低減された免疫原性を有するCAR発現免疫細胞の集団を産生することをさらに含む。
一態様では、本発明は、低減された免疫原性を有するCAR発現免疫細胞の集団を産生するための方法を提供する。一部の実施形態では、本方法は、a)1つの免疫細胞に、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原の発現を低減または排除する変異を導入し、第2の免疫細胞に、当該抗原のうちの1つの異なる変異を導入することと、b)免疫細胞に、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される少なくとも1つのポリペプチドの発現を低減または排除する変異を導入し、それによって、低減された免疫原性を有するCAR発現免疫細胞の集団を産生することと、を含む。一部の実施形態では、免疫細胞によって発現されたキメラ抗原受容体は、CD3、CD5、CD7、CD33、およびCD123からなる群から選択される抗原を標的とする。一部の実施形態では、本方法によって産生された免疫細胞は、CD3、CD5、および/またはCD7抗原を標的とし、CD3、CD5、および/もしくはCD7抗原を発現できないか、または減少したレベルのCD3、CD5、および/もしくはCD7抗原を発現するキメラ抗原受容体を発現する。一部の実施形態では、本方法によって産生された免疫細胞は、CD33およびCD123抗原を標的とし、CD33およびCD123抗原を発現できないか、または減少したレベルのCD33およびCD123抗原を発現するキメラ抗原受容体を発現する。一部の実施形態では、CARは、CD5キメラ抗原受容体(CAR)である。一部の実施形態では、CD5 CARは、表28に提示されるCD5 CAR構築物によってコードされる。
別の態様では、本発明は、低減された免疫原性を有する免疫細胞を産生するための方法を提供する。一部の実施形態では、本方法は、a)CD5の発現を低減または排除する内因性CD5の遺伝子配列または調節エレメントに変異を導入することと、b)細胞において、表28に提示されるCD5 CAR構築物を発現させることと、を含む。一部の実施形態では、CD5 CAR構築物は、以下から選択されるアミノ酸配列を含むかまたはそれからなるCD5 CARポリペプチドをコードする:
a)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKFWVLVVVGGVLACYSLLVTVAFIIFWV 420
421 RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQ 480
481 LYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGE 540
541 RRRGKGHDGLYQGLSTATKDTYDALHMQALPPR 573;
b)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
301 AGGAVHTRGLDFACDFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPR 360
361 RPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDK 420
421 RRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTAT 480
481 KDTYDALHMQALPPR 495;
c)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAIEVMYPPPYLDNEKSNGTIIHVKGKHLCPS 300
301 PLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTR 360
361 KHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDP 420
421 EMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDA 480
481 LHMQALPPR 489;
d)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKPTTTPAPRPPTPAPTIASQPLSLRPEA 420
421 CRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMR 480
481 PVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVL 540
541 DKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLST 600
601 ATKDTYDALHMQALPPR 617; または
e)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
301 AGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQT 360
361 TQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRR 420
421 DPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD 480
481 DALHMQALPPRX 494。
一部の実施形態では、本方法によって産生された免疫細胞は、対応する対照細胞と比較して、フラトリサイド耐性および/または増加した抗腫瘍活性を示す。一部の実施形態では、本方法は、インビボまたはエクスビボで実施される。一部の実施形態では、本方法によって産生された免疫細胞は、検出可能な転座を含まない。一部の実施形態では、本方法によって産生された免疫細胞は、1%未満のインデルを含む。一部の実施形態では、本方法によって産生された免疫細胞は、5%未満の非標的編集を含む。一部の実施形態では、本方法によって産生された免疫細胞は、5%未満のオフターゲット編集を含む。一部の実施形態では、変異は、核酸塩基修飾によって生成される。一部の実施形態では、変異は、エキソンにある。一部の実施形態では、変異は、タンパク質発現を低減または排除する未熟終止コドンをもたらす。一部の実施形態では、変異は、スプライスドナー部位またはスプライスアクセプター部位にある。一部の実施形態では、1つ以上の変異は、標的ポリヌクレオチドを、核酸プログラマブルDNA結合タンパク質(napDNAbp)、デアミナーゼ、および1つ以上のガイドポリヌクレオチドを含む融合タンパク質を含む塩基エディターシステムと接触させることによって生成される。
一部の実施形態では、デアミナーゼは、アデノシンデアミナーゼまたはシチジンデアミナーゼである。一部の実施形態では、シチジンデアミナーゼは、BE4である。一部の実施形態では、変異は、変異を欠く対応する対照細胞と比較して、コードされたポリペプチドの発現を少なくとも約50%以上低減する。一部の実施形態では、ガイドポリヌクレオチドは、表26に提供されるものから選択される配列を含む。一部の実施形態では、ガイドポリヌクレオチドは、AGCGACUGCAGAAAGAAGAGまたはCAUACCAGCUGAGCCGUCCGから選択される核酸配列を含む。一部の実施形態では、1つ以上のガイド核酸配列の各々は、CD5、FAS、LAG-3、CD52、TRAC、B2M、CIITA、TRBC1、TRBC2、および/またはPDC1/PD-1遺伝子もしくは調節エレメントを標的とする。一部の実施形態では、塩基エディターおよび1つ以上のガイド核酸配列は、エレクトロポレーション、ヌクレオフェクション、カチオン性脂質媒介方法、ウイルス形質導入、またはそれらの組み合わせを介して、免疫細胞に導入される。一部の実施形態では、本方法は、培養中の免疫細胞を増殖させて、免疫細胞の集団を生成することをさらに含む。一部の実施形態では、抗原またはポリペプチドの発現は、免疫細胞の集団の少なくとも約50%において減少する。一部の実施形態では、本方法は、修飾免疫細胞の集団からTCRα/β+細胞を枯渇させることをさらに含む。
一態様では、本発明は、本明細書に提供される方法のうちのいずれかによって産生された、低減された免疫原性を有するCAR発現免疫細胞を提供する。
別の態様では、本発明は、本明細書に提供される免疫細胞のうちのいずれかを含む薬学的組成物を提供する。一部の実施形態では、薬学的組成物は、薬学的に許容される賦形剤を含む。
さらに別の態様では、本発明は、腫瘍細胞を死滅させるための方法を提供する。一部の実施形態では、本方法は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍細胞を、2つ以上の免疫細胞と接触させることを含み、各免疫細胞は、細胞によって発現された当該抗原のうちの2つを標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む。一部の実施形態では、本方法は、インビトロまたはインビボで実施される。一部の実施形態では、腫瘍細胞は、腫瘍に由来する。
一態様では、本発明は、対象における腫瘍を治療するための方法を提供する。一部の実施形態では、本方法は、対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される対象の腫瘍細胞によって発現された抗原を標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、抗原の発現を低減または排除する1つ以上の変異を含み、免疫細胞の各々は、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む。
一部の実施形態では、腫瘍は、血液がんである。一部の実施形態では、腫瘍は、液体がんである。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。一部の実施形態では、血液がんは、B細胞がんである。一部の実施形態では、血液がんは、以下のうちの少なくとも1つから選択される:T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫。一部の実施形態では、血液がんは、T細胞急性リンパ芽球性白血病(T-ALL)細胞である。一部の実施形態では、血液がんは、急性骨髄性白血病(AML)である。
別の態様では、本発明は、選択された対象における腫瘍を治療するための方法を提供する。一部の実施形態では、本方法は、選択された対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞は、対象の腫瘍細胞によって発現された抗原を標的とする異なるキメラ抗原受容体を発現し、抗原は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、免疫細胞は、抗原の発現を低減または排除する1つ以上の変異を含み、免疫細胞の各々は、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含み、対象は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍を有するものとして選択される。一部の実施形態では、血液がんは、T細胞急性リンパ芽球性白血病(T-ALL)細胞である。一部の実施形態では、血液がんは、急性骨髄性白血病(AML)である。一部の実施形態では、異なるキメラ抗原受容体を発現する2つ以上の免疫細胞は、順次投与される。一部の実施形態では、異なるキメラ抗原受容体を発現する2つ以上の免疫細胞は、同時に投与される。
さらに別の態様では、本発明は、対象における腫瘍細胞の抗原依存性死滅のための方法を提供する。一部の実施形態では、本方法は、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍を有する対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞は、当該抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む。
一態様では、本発明は、対象における急性骨髄性白血病(AML)細胞の抗原依存性死滅のための方法を提供する。一部の実施形態では、本方法は、CD33およびCD123抗原を発現するAMLを有する対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞は、当該抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む。
一態様では、本発明は、対象におけるT細胞急性リンパ芽球性白血病(T-ALL)細胞の抗原依存性死滅のための方法を提供する。一部の実施形態では、本方法は、CD3、CD5、およびCD7抗原を発現するT-ALLを有する対象に、少なくとも3つの免疫細胞を投与することを含み、各免疫細胞は、当該抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む。
別の態様では、本発明は、選択された対象におけるがんを治療するための方法を提供する。一部の実施形態では、本方法は、対象に、少なくとも2つの免疫細胞を投与することを含み、各免疫細胞は、CD33またはCD123抗原を標的とするキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含み、対象は、がんをCD33およびCD123抗原を発現しているものとして特徴付けることによって、選択される。一部の実施形態では、CD33およびCD123抗原を発現しているがんは、AMLである。
さらに別の態様では、本発明は、選択された対象におけるがんを治療するための方法を提供する。一部の実施形態では、本方法は、対象に、3つ以上の免疫細胞を投与することを含み、各免疫細胞は、CD3、CD5、およびCD7抗原を標的とする異なるキメラ抗原受容体を発現し、免疫細胞は、標的抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含み、対象は、がんをCD3、CD5、およびCD7抗原を発現しているものとして特徴付けることによって、選択される。一部の実施形態では、CD3、CD5、およびCD7抗原を発現しているがんは、T-ALLである。
一部の実施形態では、免疫細胞は、細胞傷害性T細胞、制御性T細胞、Tヘルパー細胞、樹状細胞、B細胞、またはNK細胞である。一部の実施形態では、対象は、以前にリンパ枯渇により治療されたことがある。一部の実施形態では、リンパ枯渇は、シクロホスファミド、フルダラビン、および/またはアレムツズマブ(Cy/Flu/Campath)の投与を伴う。一部の実施形態では、対象は、化学療法に対して不応性であるか、または高い腫瘍負荷を有する。一部の実施形態では、対象は、その後、同種造血幹細胞移植(allo-HSCT)により治療される。一部の実施形態では、免疫細胞は、単一のヒトドナーに由来する。一部の実施形態では、免疫細胞は、対象に対して自己由来である。一部の実施形態では、免疫細胞は、対象に対して同種である。一部の実施形態では、対象は、哺乳類対象である。一部の実施形態では、対象は、ヒト対照またはげっ歯類対象である。一部の実施形態では、対象は、小児ヒト対象である。
一態様では、本発明は、がんの治療に使用するための、本明細書に提供される組成物のうちのいずれかを含むキットを提供する。別の態様では、本発明は、低減された免疫原性を有するCAR発現免疫細胞を生成する際に使用するための、本明細書に提供される塩基エディターシステムのいずれかを含むキットを提供する。一部の実施形態では、本明細書に提供されるキットのうちのいずれかは、キットの使用に関する書面による説明書を含む。
本明細書の説明および実施例は、本開示の実施形態を詳細に例示する。本開示は、本明細書に記載の特定の実施形態に限定されず、したがって変化し得ることを理解されたい。当業者は、本開示の範囲内に包含される本開示の多くの変形および修正が存在することを認識するであろう。
本明細書に開示される一部の実施形態の実践には、別段の指示がない限り、当該分野の技術の範囲内である、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノム科学、および組換えDNAの従来の技術が用いられる。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012)、the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995))、Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual、およびCulture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010))を参照されたい。
本開示の様々な特徴は、単一の実施形態の文脈で説明され得るが、その特徴はまた、別個に、または任意の好適な組み合わせで提供され得る。逆に、本開示は、明確性のために、別個の実施形態の文脈で本明細書で説明され得るが、本開示はまた、単一の実施形態でも実施され得る。本明細書で使用されるセクションの見出しは、組織化の目的のためにのみ使用され、記載される主題を限定するものとして解釈されるべきではない。
本開示の特徴は、添付の特許請求の範囲に詳細に記載されている。本開示の原理が利用される例示的な実施形態を記載する以下の詳細な説明を参照することにより、また、以下に記載される添付の図面を考慮して、本発明の特徴および利点をより良く理解することができるであろう。
定義
以下の定義は、当該技術分野における定義を補完し、本出願を対象とするものであり、任意の関連するまたは関連しない事例(例えば、任意の併有される特許または出願)に帰属するものではない。本明細書に記載されているものと同様または同等の任意の方法および材料を本開示の試験の実施に使用することができるが、好ましい材料および方法が本明細書に記載されている。したがって、本明細書で使用される用語は、特定の実施形態を説明することのみを目的とし、限定することを意図するものではない。
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解される意味を有する。以下の文献は、本発明で使用される多くの用語の一般的な定義を、当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994)、The Cambridge Dictionary of Science and Technology(Walker ed.,1988)、The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991)、およびHale&Marham,The Harper Collins Dictionary of Biology(1991)。
本出願では、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用される場合、単数形の「a」、「an」および「the」は、文脈により明らかにそうではないと指示されない限り、複数の指示対象を含むことに留意されたい。本出願において、「または」の使用は、別段の定めのない限り、「および/または」を意味し、包含的であることが理解される。さらに、「含む(including)」という用語、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の形態の使用は、限定的ではない。
本明細書および特許請求の範囲で使用される場合、「含む(comprising)」(ならびに、「含む(comprise)」および「含む(comprises)」などのその任意の形態)、「有する(having)」(ならびに、「有する(have)」および「有する(has)」などのその任意の形態)、「含む(including)」(ならびに、「含む(”includes)」および「含む」(include)などのその任意の形態)、または「含む(containing)」(ならびに、「含む(contains)」および「含む(contain)」などのその任意の形態)という単語は、包含的またはオープンエンドであり、追加の列挙されていない要素または方法ステップを除外しない。本明細書で論じられる任意の実施形態は、本開示の任意の方法または組成物に関して実施され得、逆もまた同様であることが企図される。さらに、本開示の組成物を使用して、本開示の方法を達成することができる。
「約」または「およそ」という用語は、当業者によって決定される特定の値に対する許容誤差の範囲内であることを意味し、それは、部分的には、どのようにその値が測定または決定されるか(すなわち、測定システムの限界)に依存する。例えば、「約」は、当該技術分野における慣例に従って、1標準偏差以内または1を超える標準偏差以内を意味し得る。あるいは、「約」は、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的なシステムまたはプロセスに関して、この用語は、値の5倍以内または2倍以内など、1桁以内であることを意味し得る。本出願および特許請求の範囲において特定の値が記載される場合、別段の記載がない限り、特定の値について許容誤差の範囲内であることを意味する。
本明細書に提供される範囲は、範囲内のすべての値の略記であることが理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数字の組み合わせ、または部分範囲を含むことが理解される。
本明細書における「一部の実施形態」、「実施形態」、「一実施形態」または「他の実施形態」への言及は、実施形態に関連して説明される特定の特徴、構造、または特徴が、本開示の少なくとも一部の実施形態に含まれるが、必ずしもすべての実施形態に含まれるわけではないことを意味する。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的な脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、アデノシンのイノシンへの加水分解的な脱アミノ化、またはデオキシアデノシンのデオキシイノシンへの加水分解的な脱アミノ化を触媒する。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解的な脱アミノ化を触媒する。本明細書に提供されるアデノシンデアミナーゼ(例えば、操作されたアデノシンデアミナーゼ、進化したアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。
一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然に存在するデアミナーゼのバリアントである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在しない。例えば、一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼと、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。一部の実施形態では、アデノシンデアミナーゼは、細菌(例えば、E.coli、S.aureus、B.subtilis、S.typhi、S.putrefaciens、H.influenzae、C.crescentus、またはG.sulfurreducens)由来である。一部の実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。一部の実施形態では、TadAデアミナーゼは、E.coli TadA(ecTadA)デアミナーゼまたはその断片である。
一部の実施形態では、ecTadAデアミナーゼは、切断型ecTadAである。例えば、切断型ecTadAは、全長ecTadAに対して1つ以上のN末端アミノ酸を欠損し得る。一部の実施形態では、切断型ecTadAは、全長ecTadAに対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠損し得る。一部の実施形態では、切断型ecTadAは、全長ecTadAに対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠損し得る。一部の実施形態では、ecTadAデアミナーゼは、N末端メチオニンを含まない。一部の実施形態では、TadAデアミナーゼは、N末端切断型TadAである。特定の実施形態では、TadAは、PCT/US2017/045381に記載されているTadAのうちのいずれか1つである(その全体が、参照により本明細書に援用される)。
一部の実施形態では、TadAデアミナーゼは、TadAバリアントである。一部の実施形態では、TadAバリアントは、TadA*7.10である。一部の実施形態では、TadAバリアントは、TadA*8である。一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一部の実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。一部の実施形態では、TadA*8は、TadA*8eである。一部の実施形態では、TadAバリアントは、TadA*9である。
「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリペプチド」または「ABE8」とは、以下の参照配列のアミノ酸位置82および/または166に改変を含むアデノシンデアミナーゼのバリアントを含む、本明細書で定義される塩基エディターを意味する。MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、ABE8は、参照配列と比較して、本明細書に記載されるように、さらなる改変を含む。
「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリヌクレオチド」とは、ABE8をコードするポリヌクレオチドを意味する。
「アデノシンデアミナーゼ塩基エディター9(ABE9)ポリペプチド」または「ABE9」とは、本明細書で定義される塩基エディターを意味し、以下の改変のうちの1つ以上を含むアデノシンデアミナーゼのバリアントを含む:以下の参照配列におけるR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、およびA158K。
参照配列で改変された関連する塩基を、下線および太字で示す。一部の実施形態では、ABE9は、参照配列と比較して、本明細書に記載されるように、さらなる変化を含む。ABE9塩基エディターの詳細は、国際PCT出願第PCT/2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。
「アデノシンデアミナーゼ塩基エディター9(ABE9)ポリヌクレオチド」とは、ABE9をコードするポリヌクレオチドを意味する。
「投与すること」は、本明細書において、本明細書に記載の1つ以上の組成物を患者または対象に提供することを指す。例として、限定されないが、組成物の投与(例えば、注射)は、静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、または筋肉内(i.m)注射によって行うことができる。1つ以上のかかる経路を用いることができる。非経口投与は、例えば、ボーラス注射によるか、または経時的に徐々に灌流することによって行うことができる。一部の実施形態では、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、くも膜下、および胸骨内(intrasternally)に注入または注射を含む。代替的にまたは同時に、投与を経口経路によって行うことができる。
「薬剤」とは、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、またはそれらの断片を意味する。
「変化」とは、技術分野で既知の標準的な方法(本明細書に記載されているものなど)によって検出される、遺伝子またはポリペプチドの構造、発現レベル、または活性の変化(例えば、増加または減少)を意味する。本明細書で使用される場合、変化(例えば、増加または減少)は、ポリヌクレオチド配列もしくはポリペプチド配列の変化、または発現レベルの変化(例えば、10%の変化、25%の変化、40%の変化、および50%の変化、またはそれ以上の変化)を含む。
「同種」は、本明細書で使用される場合、細胞と比較して遺伝的に異なる同じ種の細胞を指す。
「緩和する」は、疾患の発症または進行を、減少、抑制、減弱、軽減、停止、または安定させることを意味する。
「類似体」とは、同一ではないが、類似の機能的特徴または構造的特徴を有する分子を意味する。例えば、ポリヌクレオチドまたはポリペプチドの類似体は、対応する天然に存在するポリヌクレオチドまたはポリペプチドの生物学的活性を保持し、一方で、天然に存在するポリヌクレオチドまたはポリペプチドと比較して、類似体の機能を増強する特定の修飾を有する。かかる修飾は、例えば、リガンド結合を変化させることなく、類似体のDNAに対する親和性、効率、特異性、プロテアーゼ耐性もしくはヌクレアーゼ耐性、膜透過性、および/または半減期を増加させることができる。類似体は、非天然ヌクレオチドまたは非天然アミノ酸を含み得る。
「抗腫瘍活性」とは、腫瘍の成熟および/または増殖を防止または阻害することを意味する。
本明細書で使用される「自己」とは、同じ対象に由来する細胞を指す。
本明細書で使用される場合、「抗体」という用語は、特定の抗原に特異的に結合するか、またはそれと免疫学的に反応する免疫グロブリン分子を指し、抗体のポリクローナル形態、モノクローナル形態、遺伝子操作された形態、および他の方法で修飾された形態を含み、これらに限定されないが、キメラ抗体、ヒト化抗体、ヘテロ結合抗体(例えば、二重、三重、および四重特異性抗体、ダイアボディ、トリアボディ、ならびにテトラボディ)、および抗体の抗原結合断片(例えば、Fab’、F(ab’)2、Fab、Fv、rlgG、およびscFv断片が含まれる)を含む。別段の指示がない限り、「モノクローナル抗体」(mAb)という用語は、標的タンパク質に特異的に結合することができるインタクトな分子と抗体断片(例えば、FabおよびF(ab’)2断片を含む)との両方を含むことを意味する。本明細書で使用される場合、FabおよびF(ab’)2断片は、インタクトな抗体のFc断片を欠く抗体断片を指す。これらの抗体断片の例は、本明細書に記載されている。
「B細胞成熟抗原または腫瘍壊死因子受容体スーパーファミリーメンバー17ポリペプチド(BCMA)」とは、成熟Bリンパ球で発現されるNCBI受託番号NP_001183またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。例示的なBCMAポリペプチド配列を以下に提供する。
>NP_001183.2 腫瘍壊死因子受容体スーパーファミリーメンバー17[Homo sapiens]
MLQMAGQCSQNEYFDSLLHACIPCQLRCSSNTPPLTCQRYCNASVTNSVKGTNAILWTCLGLSLIISLAVFVLMFLLRKINSEPLKDEFKNTGSGLLGMANIDLEKSRTGDEIILPRGLEYTVEECTCEDCIKSKPKVDSDHCFPLPAMEEGATILVTTKTNDYCKSLPAALSATEIEKSISAR
この抗原は、再発性または難治性の多発性骨髄腫および他の血液腫瘍療法において標的とされ得る。
「B細胞成熟抗原または腫瘍壊死因子受容体スーパーファミリーメンバー17(BCMA)ポリヌクレオチド」とは、BCMAポリペプチドをコードする核酸分子を意味する。BCMA遺伝子は、B細胞活性化因子を認識する細胞表面受容体をコードする。例示的なB2Mポリヌクレオチド配列を以下に提供する。
>NM_001192.2 Homo sapiens TNF受容体スーパーファミリーメンバー17(TNFRSF17)、mRNA
AAGACTCAAACTTAGAAACTTGAATTAGATGTGGTATTCAAATCCTTAGCTGCCGCGAAGACACAGACAGCCCCCGTAAGAACCCACGAAGCAGGCGAAGTTCATTGTTCTCAACATTCTAGCTGCTCTTGCTGCATTTGCTCTGGAATTCTTGTAGAGATATTACTTGTCCTTCCAGGCTGTTCTTTCTGTAGCTCCCTTGTTTTCTTTTTGTGATCATGTTGCAGATGGCTGGGCAGTGCTCCCAAAATGAATATTTTGACAGTTTGTTGCATGCTTGCATACCTTGTCAACTTCGATGTTCTTCTAATACTCCTCCTCTAACATGTCAGCGTTATTGTAATGCAAGTGTGACCAATTCAGTGAAAGGAACGAATGCGATTCTCTGGACCTGTTTGGGACTGAGCTTAATAATTTCTTTGGCAGTTTTCGTGCTAATGTTTTTGCTAAGGAAGATAAACTCTGAACCATTAAAGGACGAGTTTAAAAACACAGGATCAGGTCTCCTGGGCATGGCTAACATTGACCTGGAAAAGAGCAGGACTGGTGATGAAATTATTCTTCCGAGAGGCCTCGAGTACACGGTGGAAGAATGCACCTGTGAAGACTGCATCAAGAGCAAACCGAAGGTCGACTCTGACCATTGCTTTCCACTCCCAGCTATGGAGGAAGGCGCAACCATTCTTGTCACCACGAAAACGAATGACTATTGCAAGAGCCTGCCAGCTGCTTTGAGTGCTACGGAGATAGAGAAATCAATTTCTGCTAGGTAATTAACCATTTCGACTCGAGCAGTGCCACTTTAAAAATCTTTTGTCAGAATAGATGATGTGTCAGATCTCTTTAGGATGACTGTATTTTTCAGTTGCCGATACAGCTTTTTGTCCTCTAACTGTGGAAACTCTTTATGTTAGATATATTTCTCTAGGTTACTGTTGGGAGCTTAATGGTAGAAACTTCCTTGGTTTCATGATTAAACTCTTTTTTTTCCTGA
「塩基エディター(BE)」または「核酸塩基エディター(NBE)」は、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。一実施形態では、薬剤は、核酸プログラマブルDNA結合タンパク質を使用して、特定の配列でポリヌクレオチドに結合する。別の実施形態では、塩基エディターは、核酸分子(例えば、DNA)内のシチジン塩基を修飾することができる酵素である。一部の実施形態では、塩基エディターは、核酸分子内の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA分子内の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNAのシチジンを脱アミノ化することができる。一部の実施形態では、塩基エディターは、シチジンデアミナーゼまたはアデノシンデアミナーゼを含む融合タンパク質である。一部の実施形態では、塩基エディターは、シチジンデアミナーゼまたはアデノシンデアミナーゼに融合されたCas9タンパク質である。一部の実施形態では、塩基エディターは、シチジンデアミナーゼまたはアデノシンデアミナーゼに融合されたCas9ニッカーゼ(nCas9)である。一部の実施形態では、塩基エディターは、塩基除去修復の阻害因子(例えば、UGIドメイン)に融合される。一部の実施形態では、融合タンパク質は、デアミナーゼに融合されたCas9ニッカーゼと、塩基除去修復の阻害因子(例えば、UGIドメイン)と、を含む。
一部の実施形態では、シチジンデアミナーゼ、またはアデノシンデアミナーゼ核酸塩基エディターポリペプチドは、以下のドメインA-B:NH-[A-B]-COOHを含み、式中、Aは、シチジンデアミナーゼドメイン、アデノシンデアミナーゼドメイン、またはその活性断片を含み、Bは、核酸配列特異的結合活性を有する1つ以上のドメインを含む。一実施形態では、前の態様のシチジンデアミナーゼまたはアデノシンデアミナーゼの核酸塩基エディターポリペプチドは、NH-[A-B]-COOHを含み、式中、Aは、シチジンデアミナーゼドメイン、アデノシンデアミナーゼドメイン、またはその活性断片を含み、nは、整数:1、2、3、4、または5であり、Bは、核酸配列特異的結合活性を有するドメインを含み、oは、整数:1、2、3、4、または5である。一実施形態では、ポリペプチドは、1つ以上の核局在化配列を含む。一実施形態では、ポリペプチドは、N末端またはC末端にある当該核局在化配列のうちの少なくとも1つを含む。一実施形態では、ポリペプチドは、核局在化シグナルを含み、二分(bipartite)核局在化シグナルである。一実施形態では、ポリペプチドは、リンカーによって連結された1つ以上のドメインを含む。
一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)およびシチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデノシンデアミナーゼに融合されたヌクレアーゼ不活性型Cas9(dCas9)である。一部の実施形態では、Cas9は、円順列変異体Cas9(例えば、spCas9またはsaCas9)である。円順列変異体Cas9は、当該技術分野で既知であり、例えば、Oakes et al.,Cell 176,254-267,2019に記載されている。一部の実施形態では、塩基エディターは、塩基除去修復の阻害因子(例えば、UGIドメイン、またはdISNドメイン)に融合される。一部の実施形態では、融合タンパク質は、デアミナーゼに融合されたCas9ニッカーゼと、塩基除去修復の阻害因子(例えば、UGIドメインまたはdISNドメイン)と、を含む。他の実施形態では、塩基エディターは、脱塩基(abasic)塩基エディターである。
一部の実施形態では、アデノシンデアミナーゼは、TadAから進化している。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、CRISPR関連(例えば、CasまたはCpf1)酵素である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合された触媒的に失活したCas9(dCas9)である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ(nCas9)である。一部の実施形態では、塩基エディターは、塩基除去修復(BER)の阻害因子に融合される。一部の実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)である。一部の実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子である。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*7.10)を、円順列変異体Cas9(例えば、spCAS9)および二分核局在化配列を含む足場にクローニングすることによって生成される。一部の実施形態では、塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*8)を、円順列変異体Cas9(例えば、spCAS9またはsaCAS9)および二分核局在化配列を含む足場にクローニングすることによって生成される(例えば、ABE8)。円順列変異体Cas9は、当該技術分野で既知であり、例えば、Oakes et al.,Cell 176,254-267,2019に記載されている。
一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、CRISPR関連(例えば、CasまたはCpf1)酵素である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合された触媒的に失活したCas9(dCas9)である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ(nCas9)である。一部の実施形態では、塩基エディターは、塩基除去修復(BER)の阻害因子に融合される。一部の実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)である。一部の実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子である。
塩基エディターの詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)および第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)、およびRees,H.A.,et al.,“Base editing:precision chemistry on the genome and transcriptome of living cells.”Nat Rev Genet.2018 Dec;19(12):770-788.doi:10.1038/s41576-018-0059-1も参照されたい(その内容全体が、参照により本明細書に援用される)。
例として、本明細書に記載の塩基エディター組成物、システム、および方法で使用されるアデニン塩基エディター(ABE)は、以下に提供される核酸配列(8877塩基対)を有する(Addgene,Watertown,MA.;Gaudelli NM,et al.,Nature.2017 Nov 23;551(7681):464-471.doi:10.1038/nature24644;Koblan LW,et al.,Nat Biotechnol.2018 Oct;36(9):843-846.doi:10.1038/nbt.4172.)。ABEの核酸配列と少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACAGCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGTATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGTGCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCACACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCCTGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGTGTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATGAACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTAGAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGGAGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCCGGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGGCACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTGGAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTGGTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCGGCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGGCTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCAGATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGGCCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGAGAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTG

AAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAGGAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ塩基エディター8(ABE8)である。一部の実施形態では、ABE8は、以下の表13、14、または16からの塩基エディターから選択される。一部の実施形態では、ABE8は、TadAから進化したアデノシンデアミナーゼのバリアントを含む。一部の実施形態では、ABE8のアデノシンデアミナーゼのバリアントは、以下の表11、13、または14に記載されるTadA*8のバリアントである。一部の実施形態では、アデノシンデアミナーゼのバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群から選択される改変のうちの1つ以上を含むTadA*7.10バリアント(例えば、TadA*8)である。様々な実施形態では、ABE8は、以下の群から選択される改変の組み合わせを有するTadA*7.10バリアント(例えば、TadA*8)を含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R。一部の実施形態では、ABE8は、単量体構築物である。一部の実施形態では、ABE8は、ヘテロ二量体構築物である。一部の実施形態では、ABE8塩基エディターは、以下の配列を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
一例として、本明細書に記載の塩基編集組成物、システム、および方法で使用されるシチジン塩基エディター(CBE)は、以下に提供される核酸配列(8877塩基対)を有する(Addgene,Watertown,MA.;Komor AC,et al.,2017,Sci Adv.,30;3(8):eaao4774.doi:10.1126/sciadv.aao4774)。BE4核酸配列と少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
1 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
61 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
121 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
181 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
241 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
301 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTGGTTT AGTGAACCGT CAGATCCGCT
361 AGAGATCCGC GGCCGCTAAT ACGACTCACT ATAGGGAGAG CCGCCACCAT GAGCTCAGAG
421 ACTGGCCCAG TGGCTGTGGA CCCCACATTG AGACGGCGGA TCGAGCCCCA TGAGTTTGAG
481 GTATTCTTCG ATCCGAGAGA GCTCCGCAAG GAGACCTGCC TGCTTTACGA AATTAATTGG
541 GGGGGCCGGC ACTCCATTTG GCGACATACA TCACAGAACA CTAACAAGCA CGTCGAAGTC
601 AACTTCATCG AGAAGTTCAC GACAGAAAGA TATTTCTGTC CGAACACAAG GTGCAGCATT
661 ACCTGGTTTC TCAGCTGGAG CCCATGCGGC GAATGTAGTA GGGCCATCAC TGAATTCCTG
721 TCAAGGTATC CCCACGTCAC TCTGTTTATT TACATCGCAA GGCTGTACCA CCACGCTGAC
781 CCCCGCAATC GACAAGGCCT GCGGGATTTG ATCTCTTCAG GTGTGACTAT CCAAATTATG
841 ACTGAGCAGG AGTCAGGATA CTGCTGGAGA AACTTTGTGA ATTATAGCCC GAGTAATGAA
901 GCCCACTGGC CTAGGTATCC CCATCTGTGG GTACGACTGT ACGTTCTTGA ACTGTACTGC
961 ATCATACTGG GCCTGCCTCC TTGTCTCAAC ATTCTGAGAA GGAAGCAGCC ACAGCTGACA
1021 TTCTTTACCA TCGCTCTTCA GTCTTGTCAT TACCAGCGAC TGCCCCCACA CATTCTCTGG
1081 GCCACCGGGT TGAAATCTGG TGGTTCTTCT GGTGGTTCTA GCGGCAGCGA GACTCCCGGG
1141 ACCTCAGAGT CCGCCACACC CGAAAGTTCT GGTGGTTCTT CTGGTGGTTC TGATAAAAAG
1201 TATTCTATTG GTTTAGCCAT CGGCACTAAT TCCGTTGGAT GGGCTGTCAT AACCGATGAA
1261 TACAAAGTAC CTTCAAAGAA ATTTAAGGTG TTGGGGAACA CAGACCGTCA TTCGATTAAA
1321 AAGAATCTTA TCGGTGCCCT CCTATTCGAT AGTGGCGAAA CGGCAGAGGC GACTCGCCTG
1381 AAACGAACCG CTCGGAGAAG GTATACACGT CGCAAGAACC GAATATGTTA CTTACAAGAA
1441 ATTTTTAGCA ATGAGATGGC CAAAGTTGAC GATTCTTTCT TTCACCGTTT GGAAGAGTCC
1501 TTCCTTGTCG AAGAGGACAA GAAACATGAA CGGCACCCCA TCTTTGGAAA CATAGTAGAT
1561 GAGGTGGCAT ATCATGAAAA GTACCCAACG ATTTATCACC TCAGAAAAAA GCTAGTTGAC
1621 TCAACTGATA AAGCGGACCT GAGGTTAATC TACTTGGCTC TTGCCCATAT GATAAAGTTC
1681 CGTGGGCACT TTCTCATTGA GGGTGATCTA AATCCGGACA ACTCGGATGT CGACAAACTG
1741 TTCATCCAGT TAGTACAAAC CTATAATCAG TTGTTTGAAG AGAACCCTAT AAATGCAAGT
1801 GGCGTGGATG CGAAGGCTAT TCTTAGCGCC CGCCTCTCTA AATCCCGACG GCTAGAAAAC
1861 CTGATCGCAC AATTACCCGG AGAGAAGAAA AATGGGTTGT TCGGTAACCT TATAGCGCTC
1921 TCACTAGGCC TGACACCAAA TTTTAAGTCG AACTTCGACT TAGCTGAAGA TGCCAAATTG
1981 CAGCTTAGTA AGGACACGTA CGATGACGAT CTCGACAATC TACTGGCACA AATTGGAGAT
2041 CAGTATGCGG ACTTATTTTT GGCTGCCAAA AACCTTAGCG ATGCAATCCT CCTATCTGAC
2101 ATACTGAGAG TTAATACTGA GATTACCAAG GCGCCGTTAT CCGCTTCAAT GATCAAAAGG
2161 TACGATGAAC ATCACCAAGA CTTGACACTT CTCAAGGCCC TAGTCCGTCA GCAACTGCCT
2221 GAGAAATATA AGGAAATATT CTTTGATCAG TCGAAAAACG GGTACGCAGG TTATATTGAC
2281 GGCGGAGCGA GTCAAGAGGA ATTCTACAAG TTTATCAAAC CCATATTAGA GAAGATGGAT
2341 GGGACGGAAG AGTTGCTTGT AAAACTCAAT CGCGAAGATC TACTGCGAAA GCAGCGGACT
2401 TTCGACAACG GTAGCATTCC ACATCAAATC CACTTAGGCG AATTGCATGC TATACTTAGA
2461 AGGCAGGAGG ATTTTTATCC GTTCCTCAAA GACAATCGTG AAAAGATTGA GAAAATCCTA
2521 ACCTTTCGCA TACCTTACTA TGTGGGACCC CTGGCCCGAG GGAACTCTCG GTTCGCATGG
2581 ATGACAAGAA AGTCCGAAGA AACGATTACT CCATGGAATT TTGAGGAAGT TGTCGATAAA
2641 GGTGCGTCAG CTCAATCGTT CATCGAGAGG ATGACCAACT TTGACAAGAA TTTACCGAAC
2701 GAAAAAGTAT TGCCTAAGCA CAGTTTACTT TACGAGTATT TCACAGTGTA CAATGAACTC
2761 ACGAAAGTTA AGTATGTCAC TGAGGGCATG CGTAAACCCG CCTTTCTAAG CGGAGAACAG
2821 AAGAAAGCAA TAGTAGATCT GTTATTCAAG ACCAACCGCA AAGTGACAGT TAAGCAATTG
2881 AAAGAGGACT ACTTTAAGAA AATTGAATGC TTCGATTCTG TCGAGATCTC CGGGGTAGAA
2941 GATCGATTTA ATGCGTCACT TGGTACGTAT CATGACCTCC TAAAGATAAT TAAAGATAAG
3001 GACTTCCTGG ATAACGAAGA GAATGAAGAT ATCTTAGAAG ATATAGTGTT GACTCTTACC
3061 CTCTTTGAAG ATCGGGAAAT GATTGAGGAA AGACTAAAAA CATACGCTCA CCTGTTCGAC
3121 GATAAGGTTA TGAAACAGTT AAAGAGGCGT CGCTATACGG GCTGGGGACG ATTGTCGCGG
3181 AAACTTATCA ACGGGATAAG AGACAAGCAA AGTGGTAAAA CTATTCTCGA TTTTCTAAAG
3241 AGCGACGGCT TCGCCAATAG GAACTTTATG CAGCTGATCC ATGATGACTC TTTAACCTTC
3301 AAAGAGGATA TACAAAAGGC ACAGGTTTCC GGACAAGGGG ACTCATTGCA CGAACATATT
3361 GCGAATCTTG CTGGTTCGCC AGCCATCAAA AAGGGCATAC TCCAGACAGT CAAAGTAGTG
3421 GATGAGCTAG TTAAGGTCAT GGGACGTCAC AAACCGGAAA ACATTGTAAT CGAGATGGCA
3481 CGCGAAAATC AAACGACTCA GAAGGGGCAA AAAAACAGTC GAGAGCGGAT GAAGAGAATA
3541 GAAGAGGGTA TTAAAGAACT GGGCAGCCAG ATCTTAAAGG AGCATCCTGT GGAAAATACC
3601 CAATTGCAGA ACGAGAAACT TTACCTCTAT TACCTACAAA ATGGAAGGGA CATGTATGTT
3661 GATCAGGAAC TGGACATAAA CCGTTTATCT GATTACGACG TCGATCACAT TGTACCCCAA
3721 TCCTTTTTGA AGGACGATTC AATCGACAAT AAAGTGCTTA CACGCTCGGA TAAGAACCGA
3781 GGGAAAAGTG ACAATGTTCC AAGCGAGGAA GTCGTAAAGA AAATGAAGAA CTATTGGCGG
3841 CAGCTCCTAA ATGCGAAACT GATAACGCAA AGAAAGTTCG ATAACTTAAC TAAAGCTGAG
3901 AGGGGTGGCT TGTCTGAACT TGACAAGGCC GGATTTATTA AACGTCAGCT CGTGGAAACC
3961 CGCCAAATCA CAAAGCATGT TGCACAGATA CTAGATTCCC GAATGAATAC GAAATACGAC
4021 GAGAACGATA AGCTGATTCG GGAAGTCAAA GTAATCACTT TAAAGTCAAA ATTGGTGTCG
4081 GACTTCAGAA AGGATTTTCA ATTCTATAAA GTTAGGGAGA TAAATAACTA CCACCATGCG
4141 CACGACGCTT ATCTTAATGC CGTCGTAGGG ACCGCACTCA TTAAGAAATA CCCGAAGCTA
4201 GAAAGTGAGT TTGTGTATGG TGATTACAAA GTTTATGACG TCCGTAAGAT GATCGCGAAA
4261 AGCGAACAGG AGATAGGCAA GGCTACAGCC AAATACTTCT TTTATTCTAA CATTATGAAT
4321 TTCTTTAAGA CGGAAATCAC TCTGGCAAAC GGAGAGATAC GCAAACGACC TTTAATTGAA
4381 ACCAATGGGG AGACAGGTGA AATCGTATGG GATAAGGGCC GGGACTTCGC GACGGTGAGA
4441 AAAGTTTTGT CCATGCCCCA AGTCAACATA GTAAAGAAAA CTGAGGTGCA GACCGGAGGG
4501 TTTTCAAAGG AATCGATTCT TCCAAAAAGG AATAGTGATA AGCTCATCGC TCGTAAAAAG
4561 GACTGGGACC CGAAAAAGTA CGGTGGCTTC GATAGCCCTA CAGTTGCCTA TTCTGTCCTA
4621 GTAGTGGCAA AAGTTGAGAA GGGAAAATCC AAGAAACTGA AGTCAGTCAA AGAATTATTG
4681 GGGATAACGA TTATGGAGCG CTCGTCTTTT GAAAAGAACC CCATCGACTT CCTTGAGGCG
4741 AAAGGTTACA AGGAAGTAAA AAAGGATCTC ATAATTAAAC TACCAAAGTA TAGTCTGTTT
4801 GAGTTAGAAA ATGGCCGAAA ACGGATGTTG GCTAGCGCCG GAGAGCTTCA AAAGGGGAAC
4861 GAACTCGCAC TACCGTCTAA ATACGTGAAT TTCCTGTATT TAGCGTCCCA TTACGAGAAG
4921 TTGAAAGGTT CACCTGAAGA TAACGAACAG AAGCAACTTT TTGTTGAGCA GCACAAACAT
4981 TATCTCGACG AAATCATAGA GCAAATTTCG GAATTCAGTA AGAGAGTCAT CCTAGCTGAT
5041 GCCAATCTGG ACAAAGTATT AAGCGCATAC AACAAGCACA GGGATAAACC CATACGTGAG
5101 CAGGCGGAAA ATATTATCCA TTTGTTTACT CTTACCAACC TCGGCGCTCC AGCCGCATTC
5161 AAGTATTTTG ACACAACGAT AGATCGCAAA CGATACACTT CTACCAAGGA GGTGCTAGAC
5221 GCGACACTGA TTCACCAATC CATCACGGGA TTATATGAAA CTCGGATAGA TTTGTCACAG
5281 CTTGGGGGTG ACTCTGGTGG TTCTGGAGGA TCTGGTGGTT CTACTAATCT GTCAGATATT
5341 ATTGAAAAGG AGACCGGTAA GCAACTGGTT ATCCAGGAAT CCATCCTCAT GCTCCCAGAG
5401 GAGGTGGAAG AAGTCATTGG GAACAAGCCG GAAAGCGATA TACTCGTGCA CACCGCCTAC
5461 GACGAGAGCA CCGACGAGAA TGTCATGCTT CTGACTAGCG ACGCCCCTGA ATACAAGCCT
5521 TGGGCTCTGG TCATACAGGA TAGCAACGGT GAGAACAAGA TTAAGATGCT CTCTGGTGGT
5581 TCTGGAGGAT CTGGTGGTTC TACTAATCTG TCAGATATTA TTGAAAAGGA GACCGGTAAG
5641 CAACTGGTTA TCCAGGAATC CATCCTCATG CTCCCAGAGG AGGTGGAAGA AGTCATTGGG
5701 AACAAGCCGG AAAGCGATAT ACTCGTGCAC ACCGCCTACG ACGAGAGCAC CGACGAGAAT
5761 GTCATGCTTC TGACTAGCGA CGCCCCTGAA TACAAGCCTT GGGCTCTGGT CATACAGGAT
5821 AGCAACGGTG AGAACAAGAT TAAGATGCTC TCTGGTGGTT CTCCCAAGAA GAAGAGGAAA
5881 GTCTAACCGG TCATCATCAC CATCACCATT GAGTTTAAAC CCGCTGATCA GCCTCGACTG
5941 TGCCTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG
6001 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG CATTGTCTGA
6061 GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG GAGGATTGGG
6121 AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA
6181 CCAGCTGGGG CTCGATACCG TCGACCTCTA GCTAGAGCTT GGCGTAATCA TGGTCATAGC
6241 TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA GCCGGAAGCA
6301 TAAAGTGTAA AGCCTAGGGT GCCTAATGAG TGAGCTAACT CACATTAATT GCGTTGCGCT
6361 CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA ATCGGCCAAC
6421 GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC
6481 TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT
6541 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG
6601 CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG
6661 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT
6721 ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA
6781 CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT AGCTCACGCT
6841 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC
6901 CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA
6961 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG
7021 TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGAACAG
7081 TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT
7141 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA
7201 CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC
7261 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA
7321 CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA
7381 CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT
7441 TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT
7501 TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT
7561 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT
7621 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA
7681 ATAGTTTGCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG
7741 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT
7801 TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG
7861 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG
7921 TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC
7981 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA
8041 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC
8101 CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT
8161 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG
8221 GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA
8281 GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA
8341 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC GACGGATCGG
8401 GAGATCGATC TCCCGATCCC CTAGGGTCGA CTCTCAGTAC AATCTGCTCT GATGCCGCAT
8461 AGTTAAGCCA GTATCTGCTC CCTGCTTGTG TGTTGGAGGT CGCTGAGTAG TGCGCGAGCA
8521 AAATTTAAGC TACAACAAGG CAAGGCTTGA CCGACAATTG CATGAAGAAT CTGCTTAGGG
8581 TTAGGCGTTT TGCGCTGCTT CGCGATGTAC GGGCCAGATA TACGCGTTGA CATTGATTAT
8641 TGACTAGTTA TTAATAGTAA TCAATTACGG GGTCATTAGT TCATAGCCCA TATATGGAGT
8701 TCCGCGTTAC ATAACTTACG GTAAATGGCC CGCCTGGCTG ACCGCCCAAC GACCCCCGCC
8761 CATTGACGTC AATAATGACG TATGTTCCCA TAGTAACGCC AATAGGGACT TTCCATTGAC
8821 GTCAATGGGT GGAGTATTTA CGGTAAACTG CCCACTTGGC AGTACATCAA GTGTATC
一部の実施形態では、シチジン塩基エディターは、BE4であり、以下のうちの1つから選択される核酸配列を有する:
元のBE4核酸配列:
ATGagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagccgcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcata

caggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctAAAAGGACGGCGGACGGATCAGAGTTCGAGAGTCCGAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化1核酸配列:
ATGTCATCCGAAACCGGGCCAGTGGCCGTAGACCCAACACTCAGGAGGCGGATAGAACCCCATGAGTTTGAAGTGTTCTTCGACCCCAGAGAGCTGCGCAAAGAGACTTGCCTCCTGTATGAAATAAATTGGGGGGGTCGCCATTCAATTTGGAGGCACACTAGCCAGAATACTAACAAACACGTGGAGGTAAATTTTATCGAGAAGTTTACCACCGAAAGATACTTTTGCCCCAATACACGGTGTTCAATTACCTGGTTTCTGTCATGGAGTCCATGTGGAGAATGTAGTAGAGCGATAACTGAGTTCCTGTCTCGATATCCTCACGTCACGTTGTTTATATACATCGCTCGGCTTTATCACCATGCGGACCCGCGGAACAGGCAAGGTCTTCGGGACCTCATATCCTCTGGGGTGACCATCCAGATAATGACGGAGCAAGAGAGCGGATACTGCTGGCGAAACTTTGTTAACTACAGCCCAAGCAATGAGGCACACTGGCCTAGATATCCGCATCTCTGGGTTCGACTGTATGTCCTTGAACTGTACTGCATAATTCTGGGACTTCCGCCATGCTTGAACATTCTGCGGCGGAAACAACCACAGCTGACCTTTTTCACGATTGCTCTCCAAAGTTGTCACTACCAGCGATTGCCACCCCACATCTTGTGGGCTACTGGACTCAAGTCTGGAGGAAGTTCAGGCGGAAGCAGCGGGTCTGAAACGCCCGGAACCTCAGAGAGCGCAACGCCCGAAAGCTCTGGAGGGTCAAGTGGTGGTAGTGATAAGAAATACTCCATCGGCCTCGCCATCGGTACGAATTCTGTCGGTTGGGCCGTTATCACCGATGAGTACAAGGTCCCTTCTAAGAAATTCAAGGTTTTGGGCAATACAGACCGCCATTCTATAAAAAAAAACCTGATCGGCGCCCTTTTGTTTGACAGTGGTGAGACTGCTGAAGCGACTCGCCTGAAGCGAACTGCCAGGAGGCGGTATACGAGGCGAAAAAACCGAATTTGTTACCTCCAGGAGATTTTCTCAAATGAAATGGCCAAGGTAGATGATAGTTTTTTTCACCGCTTGGAAGAAAGTTTTCTCGTTGAGGAGGACAAAAAGCACGAGAGGCACCCAATCTTTGGCAACATAGTCGATGAGGTCGCATACCATGAGAAATATCCTACGATCTATCATCTCCGCAAGAAGCTGGTCGATAGCACGGATAAAGCTGACCTCCGGCTGATCTACCTTGCTCTTGCTCACATGATTAAATTCAGGGGCCATTTCCTGATAGAAGGAGACCTCAATCCCGACAATTCTGATGTCGACAAACTGTTTATTCAGCTCGTTCAGACCTATAATCAACTCTTTGAGGAGAACCCCATCAATGCTTCAGGGGTGGACGCAAAGGCCATTTTGTCCGCGCGCTTGAGTAAATCACGACGCCTCGAGAATTTGATAGCTCAACTGCCGGGTGAGAAGAAAAACGGGTTGTTTGGGAATCTCATAGCGTTGAGTTTGGGACTTACGCCAAACTTTAAGTCTAACTTTGATTTGGCCGAAGATGCCAAATTGCAGCTGTCCAAAGATACCTATGATGACGACTTGGATAACCTTCTTGCGCAGATTGGTGACCAATACGCGGATCTGTTTCTTGCCGCAAAAAATCTGTCCGACGCCATACTCTTGTCCGATATACTGCGCGTCAATACTGAGATAACTAAGGCTCCCCTCAGCGCGTCCATGATTAAAAGATACGATGAGCACCACCAAGATCTCACTCTGTTGAAAGCCCTGGTTCGCCAGCAGCTTCCAGAGAAGTATAAGGAGATATTTTTCGACCAATCTAAAAACGGCTATGCGGGTTACATTGACGGTGGCGCCTCTCAAGAAGAATTCTACAAGTTTATAAAGCCGATACTTGAGAAAATGGACGGTACAGAGGAATTGTTGGTTAAGCTCAATCGCGAGGACTTGTTGAGAAAGCAGCGCACATTTGACAATGGTAGTATTCCACACCAGATTCATCTGGGCGAGTTGCATGCCATTCTTAGAAGACAAGAAGATTTTTATCCGTTTCTGAAAGATAACAGAGAAAAGATTGAAAAGATACTTACCTTTCGCATACCGTATTATGTAGGTCCCCTGGCTAGAGGGAACAGTCGCTTCGCTTGGATGACTCGAAAATCAGAAGAAACAATAACCCCCTGGAATTTTGAAGAAGTGGTAGATAAAGGTGCGAGTGCCCAATCTTTTATTGAGCGGATGACAAATTTTGACAAGAATCTGCCTAACGAAAAGGTGCTTCCCAAGCATTCCCTTTTGTATGAATACTTTACAGTATATAATGAACTGACTAAAGTGAAGTACGTTACCGAGGGGATGCGAAAGCCAGCTTTTCTCAGTGGCGAGCAGAAAAAAGCAATAGTTGACCTGCTGTTCAAGACGAATAGGAAGGTTACCGTCAAACAGCTCAAAGAAGATTACTTTAAAAAGATCGAATGTTTTGATTCAGTTGAGATAAGCGGAGTAGAGGATAGATTTAACGCAAGTCTTGGAACTTATCATGACCTTTTGAAGATCATCAAGGATAAAGATTTTTTGGACAACGAGGAGAATGAAGATATCCTGGAAGATATAGTACTTACCTTGACGCTTTTTGAAGATCGAGAGATGATCGAGGAGCGACTTAAGACGTACGCACATCTCTTTGACGATAAGGTTATGAAACAATTGAAACGCCGGCGGTATACTGGCTGGGGCAGGCTTTCTCGAAAGCTGATTAATGGTATCCGCGATAAGCAGTCTGGAAAGACAATCCTTGACTTTCTGAAAAGTGATGGATTTGCAAATAGAAACTTTATGCAGCTTATACATGATGACTCTTTGACGTTCAAGGAAGACATCCAGAAGGCACAGGTATCCGGCCAAGGGGATAGCCTCCATGAACACATAGCCAACCTGGCCGGCTCACCAGCTATTAAAAAGGGAATATTGCAAACCGTTAAGGTTGTTGACGAACTCGTTAAGGTTATGGGCCGACACAAACCAGAGAATATCGTGATTGAGATGGCTAGGGAGAATCAGACCACTCAAAAAGGTCAGAAAAATTCTCGCGAAAGGATGAAGCGAATTGAAGAGGGAATCAAAGAACTTGGCTCTCAAATTTTGAAAGAGCACCCGGTAGAAAACACTCAGCTGCAGAATGAAAAGCTGTATCTGTATTATCTGCAGAATGGTCGAGATATGTACGTTGATCAGGAGCTGGATATCAATAGGCTCAGTGACTACGATGTCGACCACATCGTTCCTCAATCTTTCCTGAAAGATGACTCTATCGACAACAAAGTGTTGACGCGATCAGATAAGAACCGGGGAAAATCCGACAATGTACCCTCAGAAGAAGTTGTCAAGAAGATGAAAAACTATTGGAGACAATTGCTGAACGCCAAGCTCATAACACAACGCAAGTTCGATAACTTGACGAAAGCCGAAAGAGGTGGGTTGTCAGAATTGGACAAAGCTGGCTTTATTAAGCGCCAATTGGTGGAGACCCGGCAGATTACGAAACACGTAGCACAAATTTTGGATTCACGAATGAATACCAAATACGACGAAAACGACAAATTGATACGCGAGGTGAAAGTGATTACGCTTAAGAGTAAGTTGGTTTCCGATTTCAGGAAGGATTTTCAGTTTTACAAAGTAAGAGAAATAAACAACTACCACCACGCCCATGATGCTTACCTCAACGCGGTAGTTGGCACAGCTCTTATCAAAAAATATCCAAAGCTGGAAAGCGAGTTCGTTTACGGTGACTATAAAGTATACGACGTTCGGAAGATGATAGCCAAATCAGAGCAGGAAATTGGGAAGGCAACCGCAAAATACTTCTTCTATTCAAACATCATGAACTTCTTTAAGACGGAGATTACGCTCGCGAACGGCGAAATACGCAAGAGGCCCCTCATAGAGACTAACGGCGAAACCGGGGAGATCGTATGGGACAAAGGACGGGACTTTGCGACCGTTAGAAAAGTACTTTCAATGCCACAAGTGAATATTGTTAAAAAGACAGAAGTACAAACAGGGGGGTTCAGTAAGGAATCCATTTTGCCCAAGCGGAACAGTGATAAATTGATAGCAAGGAAAAAAGATTGGGACCCTAAGAAGTACGGTGGTTTCGACTCTCCTACCGTTGCATATTCAGTCCTTGTAGTTGCGAAAGTGGAAAAGGGGAAAAGTAAGAAGCTTAAGAGTGTTAAAGAGCTTCTGGGCATAACCATAATGGAACGGTCTAGCTTCGAGAAAAATCCAATTGACTTTCTCGAGGCTAAAGGTTACAAGGAGGTAAAAAAGGACCTGATAATTAAACTCCCAAAGTACAGTCTCTTCGAGTTGGAGAATGGGAGGAAGAGAATGTTGGCATCTGCAGGGGAGCTCCAAAAGGGGAACGAGCTGGCTCTGCCTTCAAAATACGTGAACTTTCTGTACCTGGCCAGCCACTACGAGAAACTCAAGGGTTCTCCTGAGGATAACGAGCAGAAACAGCTGTTTGTAGAGCAGCACAAGCATTACCTGGACGAGATAATTGAGCAAATTAGTGAGTTCTCAAAAAGAGTAATCCTTGCAGACGCGAATCTGGATAAAGTTCTTTCCGCCTATAATAAGCACCGGGACAAGCCTATACGAGAACAAGCCGAGAACATCATTCACCTCTTTACCCTTACTAATCTGGGCGCGCCGGCCGCCTTCAAATACTTCGACACCACGATAGACAGGAAAAGGTATACGAGTACCAAAGAAGTACTTGACGCCACTCTCATCCACCAGTCTATAACAGGGTTGTACGAAACGAGGATAGATTTGTCCCAGCTCGGCGGCGACTCAGGAGGGTCAGGCGGCTCCGGTGGATCAACGAATCTTTCCGACATAATCGAGAAAGAAACCGGCAAACAGTTGGTGATCCAAGAATCAATCCTGATGCTGCCTGAAGAAGTAGAAGAGGTGATTGGCAACAAACCTGAGTCTGACATTCTTGTCCACACCGCGTATGACGAGAGCACGGACGAGAACGTTATGCTTCTCACTAGCGACGCCCCTGAGTATAAACCATGGGCGCTG

GTCATCCAAGATTCCAATGGGGAAAACAAGATTAAGATGCTTAGTGGTGGGTCTGGAGGGAGCGGTGGGTCCACGAACCTCAGCGACATTATTGAAAAAGAGACTGGTAAACAACTTGTAATACAAGAGTCTATTCTGATGTTGCCTGAAGAGGTGGAGGAGGTGATTGGGAACAAACCGGAGTCTGATATACTTGTTCATACCGCCTATGACGAATCTACTGATGAGAATGTGATGCTTTTaACGTCAGACGCTCCCGAGTACAAACCCTGGGCTCTGGTGATTCAGGACAGCAATGGTGAGAATAAGATTAAAATGTTGAGTGGGGGCTCAAAGCGCACGGCTGACGGTAGCGAATTTGAGAGCCCCAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化2核酸配列:
ATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTC

GTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTgGAGtaa
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に変化させるように作用することを意味する。一実施形態では、第1の塩基は、第2の塩基に変換される。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性であり、例えば、標的C・GをT・Aに変換する。別の実施形態では、塩基編集活性は、アデノシンデアミナーゼ活性またはアデニンデアミナーゼ活性であり、例えば、A・TをG・Cに変換する。別の実施形態では、塩基編集活性は、シチジンデアミナーゼ活性(例えば、標的C・GをT・Aに変換する)、およびアデノシンデアミナーゼ活性またはアデニンデアミナーゼ活性(例えば、A・TをG・Cに変換する)である。
一部の実施形態では、塩基編集活性は、編集の効率によって評価される。塩基編集効率は、任意の好適な手段(例えば、サンガー配列決定または次世代配列決定)によって測定され得る。一部の実施形態では、塩基編集効率は、塩基エディターによって実現される核酸塩基変換を伴う全配列決定リードのパーセンテージ(例えば、標的A・T塩基対がG・C塩基対に変換された、または標的C・G塩基対がT・A塩基対に変換された全配列決定リードのパーセンテージ)によって測定される。一部の実施形態では、塩基編集効率は、塩基編集が細胞集団において行われる場合、塩基エディターによって実現される核酸塩基変換を有する全細胞のパーセンテージによって測定される。
「塩基エディターシステム」という用語は、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。様々な実施形態では、塩基エディターシステムは、(1)ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、(2)当該核酸塩基を脱アミノ化するためのデアミナーゼドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)、および(3)1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターシステムは、アデノシンデアミナーゼ塩基エディター8(ABE8)である。
一部の実施形態では、ABE8は、単量体構築物である。一部の実施形態では、ABE8は、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-mである。一部の実施形態では、ABE8は、ヘテロマー構築物である。一部の実施形態では、ABE8は、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。
一部の実施形態では、塩基エディターシステムは、2つ以上の塩基編集成分を含んでもよい。例えば、塩基エディターシステムは、2つ以上のデアミナーゼを含み得る。一部の実施形態では、塩基エディターシステムは、1つ以上のシチジンデアミナーゼを含み得る。一部の実施形態では、塩基エディターシステムは、1つ以上のアデノシンデアミナーゼを含み得る。一部の実施形態では、シングルガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的指向化してもよい。一部の実施形態では、一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的指向化してもよい。
塩基エディターシステムの核酸塩基成分およびポリヌクレオチドプログラマブルヌクレオチド結合成分は、互いに共有結合的もしくは非共有結合的に、またはそれらの会合および相互作用の任意の組み合わせで、会合することができる。例えば、一部の実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するか、またはデアミナーゼドメインと会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、核酸塩基編集成分(例えば、デアミナーゼドメイン)は、追加の異種部分または異種ドメインを含むことができ、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分または異種ドメインと相互作用し得るか、会合し得るか、もしくは複合体を形成し得る。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリル(steril)αモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含んでもよい。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。一部の実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、塩基エディターシステムの核酸塩基編集成分(例えば、デアミナーゼドメイン)は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターシステムは、塩基除去修復(BER)成分の阻害因子をさらに含み得る。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。BER成分の阻害因子は、BER阻害因子を含み得る。一部の実施形態では、BERの阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)であり得る。一部の実施形態では、BERの阻害因子は、イノシンBER阻害因子であり得る。一部の実施形態では、BERの阻害因子は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、BERの阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインおよびBER阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、BERの阻害因子と非共有結合的に相互作用するか、またはBERの阻害因子と会合することによって、BERの阻害因子を標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、BER成分の阻害因子は、追加の異種部分または異種ドメインを含むことができ、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分または異種ドメインと相互作用し得るか、会合し得るか、または複合体を形成し得る。
一部の実施形態では、BERの阻害因子は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、BERの阻害因子は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、ガイドポリヌクレオチドの追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、BERの阻害剤に融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
「β2マイクログロブリン(B2M)ポリペプチド」とは、UniProt受託番号P61769またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なB2Mポリペプチド配列を以下に提供する。
>sp|P61769|B2MG_HUMAN β2マイクログロブリン OS=Homo sapiens OX=9606 GN=B2M PE=1 SV=1
MSRSVALAVLALLSLSGLEAIQRTPKIQVYSRHPAENGKSNFLNCYVSGFHPSDIEVDLLKNGERIEKVEHSDLSFSKDWSFYLLYYTEFTPTEKDEYACRVNHVTLSQPKIVKWDRDM
「β2マイクログロブリン(B2M)ポリヌクレオチド」とは、B2Mポリペプチドをコードする核酸分子を意味する。β2マイクログロブリン遺伝子は、主要組織適合複合体と会合した血清タンパク質をコードする。B2Mは、宿主CD8+T細胞による非自己認識に関与している。例示的なB2Mポリヌクレオチド配列を以下に提供する。
>DQ217933.1 Homo sapiens β2ミクログロビン(B2M)遺伝子、完全長CDS
CATGTCATAAATGGTAAGTCCAAGAAAAATACAGGTATTCCCCCCCAAAGAAAACTGTAAAATCGACTTTTTTCTATCTGTACTGTTTTTTATTGGTTTTTAAATTGGTTTTCCAAGTGAGTAAATCAGAATCTATCTGTAATGGATTTTAAATTTAGTGTTTCTCTGTGATGTAGTAAACAAGAAACTAGAGGCAAAAATAGCCCTGTCCCTTGCTAAACTTCTAAGGCACTTTTCTAGTACAACTCAACACTAACATTTCAGGCCTTTAGTGCCTTATATGAGTTTTTAAAAGGGGGAAAAGGGAGGGAGCAAGAGTGTCTTAACTCATACATTTAGGCATAACAATTATTCTCATATTTTAGTTATTGAGAGGGCTGGTAGAAAAACTAGGTAAATAATATTAATAATTATAGCGCTTATTAAACACTACAGAACACTTACTATGTACCAGGCATTGTGGGAGGCTCTCTCTTGTGCATTATCTCATTTCATTAGGTCCATGGAGAGTATTGCATTTTCTTAGTTTAGGCATGGCCTCCACAATAAAGATTATCAAAAGCCTAAAAATATGTAAAAGAAACCTAGAAGTTATTTGTTGTGCTCCTTGGGGAAGCTAGGCAAATCCTTTCAACTGAAAACCATGGTGACTTCCAAGATCTCTGCCCCTCCCCATCGCCATGGTCCACTTCCTCTTCTCACTGTTCCTCTTAGAAAAGATCTGTGGACTCCACCACCACGAAATGGCGGCACCTTATTTATGGTCACTTTAGAGGGTAGGTTTTCTTAATGGGTCTGCCTGTCATGTTTAACGTCCTTGGCTGGGTCCAAGGCAGATGCAGTCCAAACTCTCACTAAAATTGCCGAGCCCTTTGTCTTCCAGTGTCTAAAATATTAATGTCAATGGAATCAGGCCAGAGTTTGAATTCTAGTCTCTTAGCCTTTGTTTCCCCTGTCCATAAAATGAATGGGGGTAATTCTTTCCTCCTACAGTTTATTTATATATTCACTAATTCATTCATTCATCCATCCATTCGTTCATTCGGTTTACTGAGTACCTACTATGTGCCAGCCCCTGTTCTAGGGTGGAAACTAAGAGAATGATGTACCTAGAGGGCGCTGGAAGCTCTAAAGCCCTAGCAGTTACTGCTTTTACTATTAGTGGTCGTTTTTTTCTCCCCCCCGCCCCCCGACAAATCAACAGAACAAAGAAAATTACCTAAACAGCAAGGACATAGGGAGGAACTTCTTGGCACAGAACTTTCCAAACACTTTTTCCTGAAGGGATACAAGAAGCAAGAAAGGTACTCTTTCACTAGGACCTTCTCTGAGCTGTCCTCAGGATGCTTTTGGGACTATTTTTCTTACCCAGAGAATGGAGAAACCCTGCAGGGAATTCCCAAGCTGTAGTTATAAACAGAAGTTCTCCTTCTGCTAGGTAGCATTCAAAGATCTTAATCTTCTGGGTTTCCGTTTTCTCGAATGAAAAATGCAGGTCCGAGCAGTTAACTGGCTGGGGCACCATTAGCAAGTCACTTAGCATCTCTGGGGCCAGTCTGCAAAGCGAGGGGGCAGCCTTAATGTGCCTCCAGCCTGAAGTCCTAGAATGAGCGCCCGGTGTCCCAAGCTGGGGCGCGCACCCCAGATCGGAGGGCGCCGATGTACAGACAGCAAACTCACCCAGTCTAGTGCATGCCTTCTTAAACATCACGAGACTCTAAGAAAAGGAAACTGAAAACGGGAAAGTCCCTCTCTCTAACCTGGCACTGCGTCGCTGGCTTGGAGACAGGTGACGGTCCCTGCGGGCCTTGTCCTGATTGGCTGGGCACGCGTTTAATATAAGTGGAGGCGTCGCGCTGGCGGGCATTCCTGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTCTCTCTTTCTGGCCTGGAGGCTATCCAGCGTGAGTCTCTCCTACCCTCCCGCTCTGGTCCTTCCTCTCCCGCTCTGCACCCTCTGTGGCCCTCGCTGTGCTCTCTCGCTCCGTGACTTCCCTTCTCCAAGTTCTCCTTGGTGGCCCGCCGTGGGGCTAGTCCAGGGCTGGATCTCGGGGAAGCGGCGGGGTGGCCTGGGAGTGGGGAAGGGGGTGCGCACCCGGGACGCGCGCTACTTGCCCCTTTCGGCGGGGAGCAGGGGAGACCTTTGGCCTACGGCGACGGGAGGGTCGGGACAAAGTTTAGGGCGTCGATAAGCGTCAGAGCGCCGAGGTTGGGGGAGGGTTTCTCTTCCGCTCTTTCGCGGGGCCTCTGGCTCCCCCAGCGCAGCTGGAGTGGGGGACGGGTAGGCTCGTCCCAAAGGCGCGGCGCTGAGGTTTGTGAACGCGTGGAGGGGCGCTTGGGGTCTGGGGGAGGCGTCGCCCGGGTAAGCCTGTCTGCTGCGGCTCTGCTTCCCTTAGACTGGAGAGCTGTGGACTTCGTCTAGGCGCCCGCTAAGTTCGCATGTCCTAGCACCTCTGGGTCTATGTGGGGCCACACCGTGGGGAGGAAACAGCACGCGACGTTTGTAGAATGCTTGGCTGTGATACAAAGCGGTTTCGAATAATTAACTTATTTGTTCCCATCACATGTCACTTTTAAAAAATTATAAGAACTACCCGTTATTGACATCTTTCTGTGTGCCAAGGACTTTATGTGCTTTGCGTCATTTAATTTTGAAAACAGTTATCTTCCGCCATAGATAACTACTATGGTTATCTTCTGCCTCTCACAGATGAAGAAACTAAGGCACCGAGATTTTAAGAAACTTAATTACACAGGGGATAAATGGCAGCAATCGAGATTGAAGTCAAGCCTAACCAGGGCTTTTGCGGGAGCGCATGCCTTTTGGCTGTAATTCGTGCATTTTTTTTTAAGAAAAACGCCTGCCTTCTGCGTGAGATTCTCCAGAGCAAACTGGGCGGCATGGGCCCTGTGGTCTTTTCGTACAGAGGGCTTCCTCTTTGGCTCTTTGCCTGGTTGTTTCCAAGATGTACTGTGCCTCTTACTTTCGGTTTTGAAAACATGAGGGGGTTGGGCGTGGTAGCTTACGCCTGTAATCCCAGCACTTAGGGAGGCCGAGGCGGGAGGATGGCTTGAGGTCCGTAGTTGAGACCAGCCTGGCCAACATGGTGAAGCCTGGTCTCTACAAAAAATAATAACAAAAATTAGCCGGGTGTGGTGGCTCGTGCCTGTGGTCCCAGCTGCTCCGGTGGCTGAGGCGGGAGGATCTCTTGAGCTTAGGCTTTTGAGCTATCATGGCGCCAGTGCACTCCAGCGTGGGCAACAGAGCGAGACCCTGTCTCTCAAAAAAGAAAAAAAAAAAAAAAGAAAGAGAAAAGAAAAGAAAGAAAGAAGTGAAGGTTTGTCAGTCAGGGGAGCTGTAAAACCATTAATAAAGATAATCCAAGATGGTTACCAAGACTGTTGAGGACGCCAGAGATCTTGAGCACTTTCTAAGTACCTGGCAATACACTAAGCGCGCTCACCTTTTCCTCTGGCAAAACATGATCGAAAGCAGAATGTTTTGATCATGAGAAAATTGCATTTAATTTGAATACAATTTATTTACAACATAAAGGATAATGTATATATCACCACCATTACTGGTATTTGCTGGTTATGTTAGATGTCATTTTAAAAAATAACAATCTGATATTTAAAAAAAAATCTTATTTTGAAAATTTCCAAAGTAATACATGCCATGCATAGACCATTTCTGGAAGATACCACAAGAAACATGTAATGATGATTGCCTCTGAAGGTCTATTTTCCTCCTCTGACCTGTGTGTGGGTTTTGTTTTTGTTTTACTGTGGGCATAAATTAATTTTTCAGTTAAGTTTTGGAAGCTTAAATAACTCTCCAAAAGTCATAAAGCCAGTAACTGGTTGAGCCCAAATTCAAACCCAGCCTGTCTGATACTTGTCCTCTTCTTAGAAAAGATTACAGTGATGCTCTCACAAAATCTTGCCGCCTTCCCTCAAACAGAGAGTTCCAGGCAGGATGAATCTGTGCTCTGATCCCTGAGGCATTTAATATGTTCTTATTATTAGAAGCTCAGATGCAAAGAGCTCTCTTAGCTTTTAATGTTATGAAAAAAATCAGGTCTTCATTAGATTCCCCAATCCACCTCTTGATGGGGCTAGTAGCCTTTCCTTAATGATAGGGTGTTTCTAGAGAGATATATCTGGTCAAGGTGGCCTGGTACTCCTCCTTCTCCCCACAGCCTCCCAGACAAGGAGGAGTAGCTGCCTTTTAGTGATCATGTACCCTGAATATAAGTGTATTTAAAAGAATTTTATACACATATATTTAGTGTCAATCTGTATATTTAGTAGCACTAACACTTCTCTTCATTTTCAATGAAAAATATAGAGTTTATAATATTTTCTTCCCACTTCCCCATGGATGGTCTAGTCATGCCTCTCATTTTGGAAAGTACTGTTTCTGAAACATTAGGCAATATATTCCCAACCTGGCTAGTTTACAGCAATCACCTGTGGATGCTAATTAAAACGCAAATCCCACTGTCACATGCATTACTCCATTTGATCATAATGGAAAGTATGTTCTGTCCCATTTGCCATAGTCCTCACCTATCCCTGTTGTATTTTATCGGGTCCAACTCAACCATTTAAGGTATTTGCCAGCTCTTGTATGCATTTAGGTTTTGTTTCTTTGTTTTTTAGCTCATGAAATTAGGTACAAAGTCAGAGAGGGGTCTGGCATATAAAACCTCAGCAGAAATAAAGAGGTTTTGTTGTTTGGTAAGAACATACCTTGGGTTGGTTGGGCACGGTGGCTCGTGCCTGTAATCCCAACACTTTGGGAGGCCAAGGCAGGCTGATCACTTGAAGTTGGGAGTTCAAGACCAGCCTGGCCAACATGGTGAAATCCCGTCTCTACTGAAAATACAAAAATTAACCAGGCATGGTGGTGTGTGCCTGTAGTCCCAGGAATCACTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCTGAGATCTCACCACTGCACACTGCACTCCAGCCTGGGCAATGGAATGAGATTCCATCCCAAAAAATAAAAAAATAAAAAAATAAAGAACATAC

CTTGGGTTGATCCACTTAGGAACCTCAGATAATAACATCTGCCACGTATAGAGCAATTGCTATGTCCCAGGCACTCTACTAGACACTTCATACAGTTTAGAAAATCAGATGGGTGTAGATCAAGGCAGGAGCAGGAACCAAAAAGAAAGGCATAAACATAAGAAAAAAAATGGAAGGGGTGGAAACAGAGTACAATAACATGAGTAATTTGATGGGGGCTATTATGAACTGAGAAATGAACTTTGAAAAGTATCTTGGGGCCAAATCATGTAGACTCTTGAGTGATGTGTTAAGGAATGCTATGAGTGCTGAGAGGGCATCAGAAGTCCTTGAGAGCCTCCAGAGAAAGGCTCTTAAAAATGCAGCGCAATCTCCAGTGACAGAAGATACTGCTAGAAATCTGCTAGAAAAAAAACAAAAAAGGCATGTATAGAGGAATTATGAGGGAAAGATACCAAGTCACGGTTTATTCTTCAAAATGGAGGTGGCTTGTTGGGAAGGTGGAAGCTCATTTGGCCAGAGTGGAAATGGAATTGGGAGAAATCGATGACCAAATGTAAACACTTGGTGCCTGATATAGCTTGACACCAAGTTAGCCCCAAGTGAAATACCCTGGCAATATTAATGTGTCTTTTCCCGATATTCCTCAGGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAAATTTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGAGAGAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTACACTGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTGAACCATGTGACTTTGTCACAGCCCAAGATAGTTAAGTGGGGTAAGTCTTACATTCTTTTGTAAGCTGCTGAAAGTTGTGTATGAGTAGTCATATCATAAAGCTGCTTTGATATAAAAAAGGTCTATGGCCATACTACCCTGAATGAGTCCCATCCCATCTGATATAAACAATCTGCATATTGGGATTGTCAGGGAATGTTCTTAAAGATCAGATTAGTGGCACCTGCTGAGATACTGATGCACAGCATGGTTTCTGAACCAGTAGTTTCCCTGCAGTTGAGCAGGGAGCAGCAGCAGCACTTGCACAAATACATATACACTCTTAACACTTCTTACCTACTGGCTTCCTCTAGCTTTTGTGGCAGCTTCAGGTATATTTAGCACTGAACGAACATCTCAAGAAGGTATAGGCCTTTGTTTGTAAGTCCTGCTGTCCTAGCATCCTATAATCCTGGACTTCTCCAGTACTTTCTGGCTGGATTGGTATCTGAGGCTAGTAGGAAGGGCTTGTTCCTGCTGGGTAGCTCTAAACAATGTATTCATGGGTAGGAACAGCAGCCTATTCTGCCAGCCTTATTTCTAACCATTTTAGACATTTGTTAGTACATGGTATTTTAAAAGTAAAACTTAATGTCTTCCTTTTTTTTCTCCACTGTCTTTTTCATAGATCGAGACATGTAAGCAGCATCATGGAGGTAAGTTTTTGACCTTGAGAAAATGTTTTTGTTTCACTGTCCTGAGGACTATTTATAGACAGCTCTAACATGATAACCCTCACTATGTGGAGAACATTGACAGAGTAACATTTTAGCAGGGAAAGAAGAATCCTACAGGGTCATGTTCCCTTCTCCTGTGGAGTGGCATGAAGAAGGTGTATGGCCCCAGGTATGGCCATATTACTGACCCTCTACAGAGAGGGCAAAGGAACTGCCAGTATGGTATTGCAGGATAAAGGCAGGTGGTTACCCACATTACCTGCAAGGCTTTGATCTTTCTTCTGCCATTTCCACATTGGACATCTCTGCTGAGGAGAGAAAATGAACCACTCTTTTCCTTTGTATAATGTTGTTTTATTCTTCAGACAGAAGAGAGGAGTTATACAGCTCTGCAGACATCCCATTCCTGTATGGGGACTGTGTTTGCCTCTTAGAGGTTCCCAGGCCACTAGAGGAGATAAAGGGAAACAGATTGTTATAACTTGATATAATGATACTATAATAGATGTAACTACAAGGAGCTCCAGAAGCAAGAGAGAGGGAGGAACTTGGACTTCTCTGCATCTTTAGTTGGAGTCCAAAGGCTTTTCAATGAAATTCTACTGCCCAGGGTACATTGATGCTGAAACCCCATTCAAATCTCCTGTTATATTCTAGAACAGGGAATTGATTTGGGAGAGCATCAGGAAGGTGGATGATCTGCCCAGTCACACTGTTAGTAAATTGTAGAGCCAGGACCTGAACTCTAATATAGTCATGTGTTACTTAATGACGGGGACATGTTCTGAGAAATGCTTACACAAACCTAGGTGTTGTAGCCTACTACACGCATAGGCTACATGGTATAGCCTATTGCTCCTAGACTACAAACCTGTACAGCCTGTTACTGTACTGAATACTGTGGGCAGTTGTAACACAATGGTAAGTATTTGTGTATCTAAACATAGAAGTTGCAGTAAAAATATGCTATTTTAATCTTATGAGACCACTGTCATATATACAGTCCATCATTGACCAAAACATCATATCAGCATTTTTTCTTCTAAGATTTTGGGAGCACCAAAGGGATACACTAACAGGATATACTCTTTATAATGGGTTTGGAGAACTGTCTGCAGCTACTTCTTTTAAAAAGGTGATCTACACAGTAGAAATTAGACAAGTTTGGTAATGAGATCTGCAATCCAAATAAAATAAATTCATTGCTAACCTTTTTCTTTTCTTTTCAGGTTTGAAGATGCCGCATTTGGATTGGATGAATTCCAAATTCTGCTTGCTTGCTTTTTAATATTGATATGCTTATACACTTACACTTTATGCACAAAATGTAGGGTTATAATAATGTTAACATGGACATGATCTTCTTTATAATTCTACTTTGAGTGCTGTCTCCATGTTTGATGTATCTGAGCAGGTTGCTCCACAGGTAGCTCTAGGAGGGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAACATCAACATCTTGGTCAGATTTGAACTCTTCAATCTCTTGCACTCAAAGCTTGTTAAGATAGTTAAGCGTGCATAAGTTAACTTCCAATTTACATACTCTGCTTAGAATTTGGGGGAAAATTTAGAAATATAATTGACAGGATTATTGGAAATTTGTTATAATGAATGAAACATTTTGTCATATAAGATTCATATTTACTTCTTATACATTTGATAAAGTAAGGCATGGTTGTGGTTAATCTGGTTTATTTTTGTTCCACAAGTTAAATAAATCATAAAACTTGATGTGTTATCTCTTATATCTCACTCCCACTATTACCCCTTTATTTTCAAACAGGGAAACAGTCTTCAAGTTCCACTTGGTAAAAAATGTGAACCCCTTGTATATAGAGTTTGGCTCACAGTGTAAAGGGCCTCAGTGATTCACATTTTCCAGATTAGGAATCTGATGCTCAAAGAAGTTAAATGGCATAGTTGGGGTGACACAGCTGTCTAGTGGGAGGCCAGCCTTCTATATTTTAGCCAGCGTTCTTTCCTGCGGGCCAGGTCATGAGGAGTATGCAGACTCTAAGAGGGAGCAAAAGTATCTGAAGGATTTAATATTTTAGCAAGGAATAGATATACAATCATCCCTTGGTCTCCCTGGGGGATTGGTTTCAGGACCCCTTCTTGGACACCAAATCTATGGATATTTAAGTCCCTTCTATAAAATGGTATAGTATTTGCATATAACCTATCCACATCCTCCTGTATACTTTAAATCATTTCTAGATTACTTGTAATACCTAATACAATGTAAATGCTATGCAAATAGTTGTTATTGTTTAAGGAATAATGACAAGAAAAAAAAGTCTGTACATGCTCAGTAAAGACACAACCATCCCTTTTTTTCCCCAGTGTTTTTGATCCATGGTTTGCTGAATCCACAGATGTGGAGCCCCTGGATACGGAAGGCCCGCTGTACTTTGAATGACAAATAACAGATTTAAA
「Cas9」または「Cas9ドメイン」という用語は、Cas9タンパク質またはその断片(例えば、Cas9の活性、不活性、もしくは部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質)を含むRNAガイドヌクレアーゼを指す。Cas9ヌクレアーゼは、Casn1ヌクレアーゼまたはCRISPR(「クラスター化された規則的な間隔の短い回文反復」)関連ヌクレアーゼとも呼ばれることがある。CRISPRは、可動遺伝要素(ウイルス、転位要素、および接合性プラスミド)に対する保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターが転写され、CRISPR RNA(crRNA)に加工される。II型CRISPRシステムでは、crRNA前駆体(pre-crRNA)の正しいプロセシングには、トランスコード化低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、およびCas9タンパク質が必要である。tracrRNAは、crRNA前駆体のリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合およびDNA切断は、典型的には、タンパク質および両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」、または単に「gRNA」)は、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように操作することができる。例えば、Jinek M.,et al.,Charpentier E.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。Cas9は、CRISPR反復配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己の区別を助ける。Cas9ヌクレアーゼの配列および構造は、当業者に周知である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その各々の内容全体が、参照により本明細書に援用される)。Cas9オーソログは、これらに限定されないが、S.pyogenesおよびS.thermophilusを含む様々な種で記載されている。さらなる好適なCas9ヌクレアーゼおよび配列は、本開示に基づいて、当業者には明らかであり、かかるCas9ヌクレアーゼおよび配列には、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物および遺伝子座に由来するCas9配列が含まれる(それらの内容全体が、参照により本明細書に援用される)。
ヌクレアーゼ不活性化Cas9タンパク質は、互換的に、「dCas9」タンパク質(ヌクレアーゼ-「不活性型(dead)」Cas9の場合)または触媒不活性Cas9と称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成するための方法は既知である。例えば、Jinek et al.,Science.337:816-821(2012)、Qi et al.,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013)Cell.28;152(5):1173-83を参照されたい(それらの各々の内容全体が、参照により本明細書に援用される)。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン(HNHヌクレアーゼサブドメインおよびRuvC1サブドメイン)を含むことが知られている。HNHサブドメインは、gRNAに相補的な鎖を切断し、一方、RuvC1サブドメインは、非相補的な鎖を切断する。これらのサブドメイン内の変異は、Cas9のヌクレアーゼ活性をサイレンシングすることができる。例えば、変異D10AおよびH840Aは、S.pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。一部の実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に、部分的もしくは全体的に対応するか、またはそれを含む。一部の実施形態では、dCas9ドメインは、別のCas9のD10AおよびH840A変異または対応する変異を含む。一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、(「ニッカーゼ」Cas9の場合)Cas9は、ニッカーゼであり、「nCas9」タンパク質と称される。追加のCas9タンパク質(例えば、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性型Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内であることを理解されたい。例示的なCas9タンパク質としては、本明細書に提供されるものが挙げられるが、これらに限定されない。一部の実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性型Cas9(dCas9)である。一部の実施形態では、Cas9タンパク質はCas9ニッカーゼ(nCas9)である。一部の実施形態では、Cas9タンパク質は、ヌクレアーゼ活性型Cas9である。
一部の実施形態では、Cas9の断片を含むタンパク質が提供される。例えば、一部の実施形態では、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1)Cas9のgRNA結合ドメイン、または(2)Cas9のDNA切断ドメイン。一部の実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上のアミノ酸変化を有し得る。一部の実施形態では、Cas9バリアントは、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、そのため、その断片は、野生型Cas9の対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
一部の実施形態では、断片は、少なくとも100アミノ酸長である。一部の実施形態では、断片は、長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
一部の実施形態では、Cas9は、Corynebacterium ulcerans(NCBI参照:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照:NC_021284.1)、Prevotella intermedia(NCBI参照:NC_017861.1)、Spiroplasma taiwanense(NCBI参照:NC_021846.1)、Streptococcus iniae(NCBI参照:NC_021314.1)、Belliella baltica(NCBI参照:NC_018010.1)、Psychroflexus torquis I(NCBI参照:NC_018721.1)、Streptococcus thermophilus(NCBI参照:YP_820832.1)、Listeria innocua(NCBI参照:NP_472073.1)、Campylobacter jejuni(NCBI参照:YP_002344900.1)またはNeisseria meningitidis(NCBI参照:YP_002342100.1)に由来するCas9、または任意の他の生物由来のCas9を指す。
一部の実施形態では、Cas9は、Neisseria meningitidis(Nme)に由来する。一部の実施形態では、Cas9は、Nme1、Nme2またはNme3である。一部の実施形態では、Nme1、Nme2、またはNme3のPAM相互作用ドメインは、それぞれ、NGAT、NCC、およびNCAAAである(例えば、Edraki,A.,et al.,A Compact,High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing,Molecular Cell(2018)を参照されたい)。
一部の実施形態では、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列(例えば、本明細書に提供されるCas9配列のうちの1つ)を含む。しかしながら、他の実施形態では、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、1つ以上のその断片のみを含む。例えば、一部の実施形態では、本明細書に提供されるCas9融合タンパク質は、Cas9断片を含み、断片は、crRNAおよびtracrRNAまたはsgRNAに結合するが、機能的ヌクレアーゼドメインを含まない(例えば、ヌクレアーゼドメインの切断型バージョンのみを含むか、またはヌクレアーゼドメインを全く含まない)。
好適なCas9ドメインおよびCas9断片の例示的なアミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
一部の実施形態では、Cas9は、単細胞性原核微生物のドメインおよび界を構成する古細菌(例えば、ナノ古細菌)由来のCas9を指す。一部の実施形態では、Cas9は、CasXまたはCasYを指し、これらは、例えば、Burstein et al.,“New CRISPR-Cas systems from uncultivated microbes.”Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されている(その内容全体が、参照により本明細書に援用される)。ゲノム解像メタゲノミクスを使用して、いくつかのCRISPR-Casシステムが同定されており、生命の古細菌ドメインで最初に報告されたCas9が含まれる。この多岐にわたるCas9タンパク質は、活性なCRISPR-Casシステムの一部として、ほとんど研究されていなかったナノ古細菌において見出された。細菌では、これまでに知られていなかった2つの系、CRISPR-CasXおよびCRISPR-CasYが発見されたが、これらは、これまでに発見された中で最もコンパクトなシステムのうちの1つである。一部の実施形態では、Cas9は、CasX、またはCasXのバリアントを指す。一部の実施形態では、Cas9は、CasY、またはCasYのバリアントを指す。他のRNAガイドDNA結合タンパク質が、核酸プログラマブルDNA結合タンパク質(napDNAbp)として使用されてもよく、それらが本開示の範囲内であることを理解されたい。
特定の実施形態では、本発明の方法で有用なnapDNAbpsには、当該技術分野で既知であり、例えば、Oakes et al.,Cell 176,254-267,2019に記載されている円順列変異体が含まれる。
塩基エディターに組み込まれ得るポリヌクレオチドプログラマブルヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。
一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)または本明細書に提供される融合タンパク質のうちのいずれかは、CasXまたはCasYタンパク質であり得る。一部の実施形態では、napDNAbpは、CasXタンパク質である。一部の実施形態では、napDNAbpは、CasYタンパク質である。一部の実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本開示に従って、他の細菌種由来のCasXおよびCasYも使用され得ることを理解されたい。
「Cas12b」または「Cas12bドメイン」という用語は、Cas12b/C2c1タンパク質またはその断片(例えば、Cas12bの活性、不活性、もしくは部分的に活性なDNA切断ドメイン、および/またはCas12bのgRNA結合ドメインを含むタンパク質)を含むRNAガイドヌクレアーゼを指す(これらの各々の内容は、参照により本明細書に援用される)。Cas12bオーソログには、Alicyclobacillus acidoterrestris、Alicyclobacillus acidophilus(Teng et al.,Cell Discov.2018 Nov 27;4:63)、Bacillus hisashi、およびBacillus種V3-13が含まれるが、これらに限定されない。さらなる好適なCas12bヌクレアーゼおよび配列は、本開示に基づいて、当業者には明らかであろう。
一部の実施形態では、Cas12bまたはその断片を含むタンパク質は、「Cas12bバリアント」と称される。Cas12bバリアントは、Cas12bまたはその断片と相同性を共有する。例えば、Cas12bバリアントは、野生型Cas12bと、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas12bバリアントは、野生型Cas12bと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上のアミノ酸変化を有し得る。一部の実施形態では、Cas12bバリアントは、Cas12bの断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、そのため、その断片は、野生型Cas12bの対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、断片は、対応する野生型Cas12bのアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。例示的なCas12bポリペプチドは、本明細書に列挙されている。
「Cblがん原遺伝子B(CBLB)ポリペプチド」とは、免疫応答の調節に関与するGenBank受託番号ABC86700.1またはその断片と、少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。例示的なCBLBポリペプチド配列を以下に提供する。
>ABC86700.1 CBL-B[Homo sapiens]
MANSMNGRNPGGRGGNPRKGRILGIIDAIQDAVGPPKQAAADRRTVEKTWKLMDKVVRLCQNPKLQLKNSPPYILDILPDTYQHLRLILSKYDDNQKLAQLSENEYFKIYIDSLMKKSKRAIRLFKEGKERMYEEQSQDRRNLTKLSLIFSHMLAEIKAIFPNGQFQGDNFRITKADAAEFWRKFFGDKTIVPWKVFRQCLHEVHQISSGLEAMALKSTIDLTCNDYISVFEFDIFTRLFQPWGSILRNWNFLAVTHPGYMAFLTYDEVKARLQKYSTKPGSYIFRLSCTRLGQWAIGYVTGDGNILQTIPHNKPLFQALIDGSREGFYLYPDGRSYNPDLTGLCEPTPHDHIKVTQEQYELYCEMGSTFQLCKICAENDKDVKIEPCGHLMCTSCLTAWQESDGQGCPFCRCEIKGTEPIIVDPFDPRDEGSRCCSIIDPFGMPMLDLDDDDDREESLMMNRLANVRKCTDRQNSPVTSPGSSPLAQRRKPQPDPLQIPHLSLPPVPPRLDLIQKGIVRSPCGSPTGSPKSSPCMVRKQDKPLPAPPPPLRDPPPPPPERPPPIPPDNRLSRHIHHVESVPSRDPPMPLEAWCPRDVFGTNQLVGCRLLGEGSPKPGITASSNVNGRHSRVGSDPVLMRKHRRHDLPLEGAKVFSNGHLGSEEYDVPPRLSPPPPVTTLLPSIKCTGPLANSLSEKTRDPVEEDDDEYKIPSSHPVSLNSQPSHCHNVKPPVRSCDNGHCMLNGTHGPSSEKKSNIPDLSIYLKGDVFDSASDPVPLPPARPPTRDNPKHGSSLNRTPSDYDLLIPPLGEDAFDALPPSLPPPPPPARHSLIEHSKPPGSSSRPSSGQDLFLLPSDPFVDLASGQVPLPPARRLPGENVKTNRTSQDYDQLPSCSDGSQAPARPPKPRPRRTAPEIHHRKPHGPEAALENVDAKIAKLMGEGYAFEEVKRALEIAQNNVEVARSILREFAFPPPVSPRLNL
「Cblがん原遺伝子B(CBLB)ポリヌクレオチド」とは、CBLBポリペプチドをコードする核酸分子を意味する。CBLB遺伝子は、E3ユビキチンリガーゼをコードする。例示的なCBLB核酸配列を以下に提供する。
>DQ349203.1 Homo sapiens CBL-B mRNA、完全長CDS
ATGGCAAACTCAATGAATGGCAGAAACCCTGGTGGTCGAGGAGGAAATCCCCGAAAAGGTCGAATTTTGGGTATTATTGATGCTATTCAGGATGCAGTTGGACCCCCTAAGCAAGCTGCCGCAGATCGCAGGACCGTGGAGAAGACTTGGAAGCTCATGGACAAAGTGGTAAGACTGTGCCAAAATCCCAAACTTCAGTTGAAAAATAGCCCACCATATATACTTGATATTTTGCCTGATACATATCAGCATTTACGACTTATATTGAGTAAATATGATGACAACCAGAAACTTGCCCAACTCAGTGAGAATGAGTACTTTAAAATCTACATTGATAGCCTTATGAAAAAGTCAAAACGGGCAATAAGACTCTTTAAAGAAGGCAAGGAGAGAATGTATGAAGAACAGTCACAGGACAGACGAAATCTCACAAAACTGTCCCTTATCTTCAGTCACATGCTGGCAGAAATCAAAGCAATCTTTCCCAATGGTCAATTCCAGGGAGATAACTTTCGTATCACAAAAGCAGATGCTGCTGAATTCTGGAGAAAGTTTTTTGGAGACAAAACTATCGTACCATGGAAAGTATTCAGACAGTGCCTTCATGAGGTCCACCAGATTAGCTCTGGCCTGGAAGCAATGGCTCTAAAATCAACAATTGATTTAACTTGCAATGATTACATTTCAGTTTTTGAATTTGATATTTTTACCAGGCTGTTTCAGCCTTGGGGCTCTATTTTGCGGAATTGGAATTTCTTAGCTGTGACACATCCAGGTTACATGGCATTTCTCACATATGATGAAGTTAAAGCACGACTACAGAAATATAGCACCAAACCCGGAAGCTATATTTTCCGGTTAAGTTGCACTCGATTGGGACAGTGGGCCATTGGCTATGTGACTGGGGATGGGAATATCTTACAGACCATACCTCATAACAAGCCCTTATTTCAAGCCCTGATTGATGGCAGCAGGGAAGGATTTTATCTTTATCCTGATGGGAGGAGTTATAATCCTGATTTAACTGGATTATGTGAACCTACACCTCATGACCATATAAAAGTTACACAGGAACAATATGAATTATATTGTGAAATGGGCTCCACTTTTCAGCTCTGTAAGATTTGTGCAGAGAATGACAAAGATGTCAAGATTGAGCCTTGTGGGCATTTGATGTGCACCTCTTGCCTTACGGCATGGCAGGAGTCGGATGGTCAGGGCTGCCCTTTCTGTCGTTGTGAAATAAAAGGAACTGAGCCCATAATCGTGGACCCCTTTGATCCAAGAGATGAAGGCTCCAGGTGTTGCAGCATCATTGACCCCTTTGGCATGCCGATGCTAGACTTGGACGACGATGATGATCGTGAGGAGTCCTTGATGATGAATCGGTTGGCAAACGTCCGAAAGTGCACTGACAGGCAGAACTCACCAGTCACATCACCAGGATCCTCTCCCCTTGCCCAGAGAAGAAAGCCACAGCCTGACCCACTCCAGATCCCACATCTAAGCCTGCCACCCGTGCCTCCTCGCCTGGATCTAATTCAGAAAGGCATAGTTAGATCTCCCTGTGGCAGCCCAACGGGTTCACCAAAGTCTTCTCCTTGCATGGTGAGAAAACAAGATAAACCACTCCCAGCACCACCTCCTCCCTTAAGAGATCCTCCTCCACCGCCACCTGAAAGACCTCCACCAATCCCACCAGACAATAGACTGAGTAGACACATCCATCATGTGGAAAGCGTGCCTTCCAGAGACCCGCCAATGCCTCTTGAAGCATGGTGCCCTCGGGATGTGTTTGGGACTAATCAGCTTGTGGGATGTCGACTCCTAGGGGAGGGCTCTCCAAAACCTGGAATCACAGCGAGTTCAAATGTCAATGGAAGGCACAGTAGAGTGGGCTCTGACCCAGTGCTTATGCGGAAACACAGACGCCATGATTTGCCTTTAGAAGGAGCTAAGGTCTTTTCCAATGGTCACCTTGGAAGTGAAGAATATGATGTTCCTCCCCGGCTTTCTCCTCCTCCTCCAGTTACCACCCTCCTCCCTAGCATAAAGTGTACTGGTCCGTTAGCAAATTCTCTTTCAGAGAAAACAAGAGACCCAGTAGAGGAAGATGATGATGAATACAAGATTCCTTCATCCCACCCTGTTTCCCTGAATTCACAACCATCTCATTGTCATAATGTAAAACCTCCTGTTCGGTCTTGTGATAATGGTCACTGTATGCTGAATGGAACACATGGTCCATCTTCAGAGAAGAAATCAAACATCCCTGACTTAAGCATATATTTAAAGGGAGATGTTTTTGATTCAGCCTCTGATCCCGTGCCATTACCACCTGCCAGGCCTCCAACTCGGGACAATCCAAAGCATGGTTCTTCACTCAACAGGACGCCCTCTGATTATGATCTTCTCATCCCTCCATTAGGTGAAGATGCTTTTGATGCCCTCCCTCCATCTCTCCCACCTCCCCCACCTCCTGCAAGGCATAGTCTCATTGAACATTCAAAACCTCCTGGCTCCAGTAGCCGGCCATCCTCAGGACAGGATCTTTTTCTTCTTCCTTCAGATCCCTTTGTTGATCTAGCAAGTGGCCAAGTTCCTTTGCCTCCTGCTAGAAGGTTACCAGGTGAAAATGTCAAAACTAACAGAACATCACAGGACTATGATCAGCTTCCTTCATGTTCAGATGGTTCACAGGCACCAGCCAGACCCCCTAAACCACGACCGCGCAGGACTGCACCAGAAATTCACCACAGAAAACCCCATGGGCCTGAGGCGGCATTGGAAAATGTCGATGCAAAAATTGCAAAACTCATGGGAGAGGGTTATGCCTTTGAAGAGGTGAAGAGAGCCTTAGAGATAGCCCAGAATAATGTCGAAGTTGCCCGGAGCATCCTCCGAGAATTTGCCTTCCCTCCTCCAGTATCCCCACGTCTAAATCTATAG
「キメラ抗原受容体」または「CAR」とは、免疫エフェクター細胞に抗原に対する特異性を付与する1つ以上の細胞内シグナル伝達ドメイン(例えば、T細胞シグナル伝達ドメイン)に連結された細胞外抗原結合ドメインを含む合成または操作された受容体を意味する。一部の実施形態では、CARは、膜貫通ドメインを含む。
「キメラ抗原受容体T細胞」または「CAR-T細胞」とは、CARを発現するT細胞を意味し、CARの抗体由来標的指向化ドメインによって決定される抗原特異性を有する。本明細書で使用される場合、「CAR-T細胞」は、T細胞またはNK細胞を含む。本明細書で使用される場合、「CAR-T細胞」は、CARまたはT細胞受容体(TCR)を発現するように操作された細胞を含む。一部の実施形態では、CAR-T細胞は、任意選択的に、所定の割合のTヘルパーCD4+細胞および/またはTエフェクターCD8+細胞であり得る。(例えば、がんの治療用に)CARを作製する方法は、公的に利用可能である(例えば、Park et al.,Trends Biotechnol.,29:550-557,2011、Grupp et al.,N Engl J Med.,368:1509-1518,2013、Han et al.,J.Hematol Oncol.6:47,2013、Haso et al.,(2013)Blood,121,1165-1174;PCT Pubs、WO2012/079000、WO2013/059593、および米国公開第2012/0213783号を参照されたい(これらの各々は、その全体が参照により本明細書に援用される)。
「クラスII主要組織適合複合体トランスアクチベーター(CIITA)」とは、NCBI受託番号NP_001273331.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_001273331.1 MHCクラスIIトランスアクチベーターアイソフォーム1[Homo sapiens]
MRCLAPRPAGSYLSEPQGSSQCATMELGPLEGGYLELLNSDADPLCLYHFYDQMDLAGEEEIELYSEPDTDTINCDQFSRLLCDMEGDEETREAYANIAELDQYVFQDSQLEGLSKDIFIEHIGPDEVIGESMEMPAEVGQKSQKRPFPEELPADLKHWKPAEPPTVVTGSLLVGPVSDCSTLPCLPLPALFNQEPASGQMRLEKTDQIPMPFSSSSLSCLNLPEGPIQFVPTISTLPHGLWQISEAGTGVSSIFIYHGEVPQASQVPPPSGFTVHGLPTSPDRPGSTSPFAPSATDLPSMPEPALTSRANMTEHKTSPTQCPAAGEVSNKLPKWPEPVEQFYRSLQDTYGAEPAGPDGILVEVDLVQARLERSSSKSLERELATPDWAERQLAQGGLAEVLLAAKEHRRPRETRVIAVLGKAGQGKSYWAGAVSRAWACGRLPQYDFVFSVPCHCLNRPGDAYGLQDLLFSLGPQPLVAADEVFSHILKRPDRVLLILDGFEELEAQDGFLHSTCGPAPAEPCSLRGLLAGLFQKKLLRGCTLLLTARPRGRLVQSLSKADALFELSGFSMEQAQAYVMRYFESSGMTEHQDRALTLLRDRPLLLSHSHSPTLCRAVCQLSEALLELGEDAKLPSTLTGLYVGLLGRAALDSPPGALAELAKLAWELGRRHQSTLQEDQFPSADVRTWAMAKGLVQHPPRAAESELAFPSFLLQCFLGALWLALSGEIKDKELPQYLALTPRKKRPYDNWLEGVPRFLAGLIFQPPARCLGALLGPSAAASVDRKQKVLARYLKRLQPGTLRARQLLELLHCAHEAEEAGIWQHVVQELPGRLSFLGTRLTPPDAHVLGKALEAAGQDFSLDLRSTGICPSGLGSLVGLSCVTRFRAALSDTVALWESLQQHGETKLLQAAEEKFTIEPFKAKSLKDVEDLGKLVQTQRTRSSSEDTAGELPAVRDLKKLEFALGPVSGPQAFPKLVRILTAFSSLQHLDLDALSENKIGDEGVSQLSATFPQLKSLETLNLSQNNITDLGAYKLAEALPSLAASLLRLSLYNNCICDVGAESLARVLPDMVSLRVMDVQYNKFTAAGAQQLAASLRRCPHVETLAMWTPTIPFSVQEHLQQQDSRISLR
「クラスII主要組織適合複合体トランスアクチベーター(CIITA)」とは、CIITAポリペプチドをコードする核酸を意味する。例示的なCIITA核酸配列を以下に提供する。
>NM_001286402.1 Homo sapiens クラスII主要組織適合複合体トランスアクチベーター(CIITA)、転写バリアント1、mRNA
GGTTAGTGATGAGGCTAGTGATGAGGCTGTGTGCTTCTGAGCTGGGCATCCGAAGGCATCCTTGGGGAAGCTGAGGGCACGAGGAGGGGCTGCCAGACTCCGGGAGCTGCTGCCTGGCTGGGATTCCTACACAATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGATCCCAGCTGTGCTCTGGACAGGCATGTTCTCTGAGGACACTAACCACGCTGGACCTTGAACTGGGTACTTGTGGACACAGCTCTTCTCCAGGCTGTATCCCATGAGCCTCAGCATCCTGGCACCCGGCCCCTGCTGGTTCAGGGTTGGCCCCTGCCCGGCTGCGGAATGAACCACATCTTGCTCTGCTGACAGACACAGGCCCGGCTCCAGGCTCCTTTAGCGCCCAGTTGGGTGGATGCCTGGTGGCAGCTGCGGTCCACCCAGGAGCCCCGAGGCCTTCTCTGAAGGACATTGCGGACAGCCACGGCCAGGCCAGAGGGAGTGACAGAGGCAGCCCCATTCTGCCTGCCCAGGCCCCTGCCACCCTGGGGAGAAAGTACTTCTTTTTTTTTATTTTTAGACAGAGTCTCACTGTTGCCCAGGCTGGCGTGCAGTGGTGCGATCTGGGTTCACTGCAACCTCCGCCTCTTGGGTTCAAGCGATTCTTCTGCTTCAGCCTCCCGAGTAGCTGGGACTACAGGCACCCACCATCATGTCTGGCTAATTTTTCATTTTTAGTAGAGACAGGGTTTTGCCATGTTGGCCAGGCTGGTCTCAAACTCTTGACCTCAGGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTACAAGCGTGAGCCACTGCACCGGGCCACAGAGAAAGTACTTCTCCACCCTGCTCTCCGACCAGACACCTTGACAGGGCACACCGGGCACTCAGAAGACACTGATGGGCAACCCCCAGCCTGCTAATTCCCCAGATTGCAACAGGCTGGGCTTCAGTGGCAGCTGCTTTTGTCTATGGGACTCAATGCACTGACATTGTTGGCCAAAGCCAAAGCTAGGCCTGGCCAGATGCACCAGCCCTTAGCAGGGAAACAGCTAATGGGACACTAATGGGGCGGTGAGAGGGGAACAGACTGGAAGCACAGCTTCATTTCCTGTGTCTTTTTTCACTACATTATAAATGTCTCTTTAATGTCACAGGCAGGTCCAGGGTTTGAGTTCATACCCTGTTACCATTTTGGGGTACCCACTGCTCTGGTTATCTAATATGTAACAAGCCACCCCAAATCATAGTGGCTTAAAACAACACTCACATTTA
本開示において、「含む(comprises)」、「含む(comprising)」、「含む(containing)」、および「有する(having)」などは、米国特許法においてそれらに付与される意味を有し得、「含む(includes)」、「含む(including)」などを意味し得る。同様に、「から本質的になる(consisting essentially of)」または「本質的になる(consists essentially)」は、米国特許法において付与される意味を有し、その用語は、オープンエンドであり、列挙されているものの基本的な特徴または新規の特徴が、列挙されているものよりも多くの存在によって変わらない限り、列挙されているものよりも多くのの存在が可能になるが、先行技術の実施形態は除外される。
「細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)ポリペプチド」とは、NCBI受託番号EAW70354.1またはその断片と少なくとも約85%の配列同一性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する:
>EAW70354.1 細胞傷害性Tリンパ球関連タンパク質4[Homo sapiens]
MACLGFQRHKAQLNLATRTWPCTLLFFLLFIPVFCKAMHVAQPAVVLASSRGIASFVCEYASPGKATEVRVTVLRQADSQVTEVCAATYMMGNELTFLDDSICTGTSSGNQVNLTIQGLRAMDTGLYICKVELMYPPPYYLGIGNGTQIYVIDPEPCPDSDFLLWILAAVSSGLFFYSFLLTAVSLSKMLKKRSPLTTGVYVKMPPTEPECEKQFQPYFIPIN
「細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)ポリヌクレオチド」とは、CTLA-4ポリペプチドをコードする核酸分子を意味する。CTLA-4遺伝子は、免疫グロブリンスーパーファミリーをコードし、抑制性シグナルをT細胞に伝達するタンパク質をコードする。例示的なCTLA-4核酸配列を以下に提供する。
>BC074842.2 Homo sapiens細胞傷害性Tリンパ球関連タンパク質4、mRNA(cDNAクローン MGC:104099 IMAGE:30915552)、完全長CDS
GACCTGAACACCGCTCCCATAAAGCCATGGCTTGCCTTGGATTTCAGCGGCACAAGGCTCAGCTGAACCTGGCTACCAGGACCTGGCCCTGCACTCTCCTGTTTTTTCTTCTCTTCATCCCTGTCTTCTGCAAAGCAATGCACGTGGCCCAGCCTGCTGTGGTACTGGCCAGCAGCCGAGGCATCGCCAGCTTTGTGTGTGAGTATGCATCTCCAGGCAAAGCCACTGAGGTCCGGGTGACAGTGCTTCGGCAGGCTGACAGCCAGGTGACTGAAGTCTGTGCGGCAACCTACATGATGGGGAATGAGTTGACCTTCCTAGATGATTCCATCTGCACGGGCACCTCCAGTGGAAATCAAGTGAACCTCACTATCCAAGGACTGAGGGCCATGGACACGGGACTCTACATCTGCAAGGTGGAGCTCATGTACCCACCGCCATACTACCTGGGCATAGGCAACGGAACCCAGATTTATGTAATTGATCCAGAACCGTGCCCAGATTCTGACTTCCTCCTCTGGATCCTTGCAGCAGTTAGTTCGGGGTTGTTTTTTTATAGCTTTCTCCTCACAGCTGTTTCTTTGAGCAAAATGCTAAAGAAAAGAAGCCCTCTTACAACAGGGGTCTATGTGAAAATGCCCCCAACAGAGCCAGAATGTGAAAAGCAATTTCAGCCTTATTTTATTCCCATCAATTGAGAAACCATTATGAAGAAGAGAGTCCATATTTCAATTTCCAAGAGCTGAGG
「表面抗原分類2(CD2)ポリペプチド」とは、NCBI受託番号NP_001758.2またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_001758.2 T細胞表面抗原CD2アイソフォーム2前駆体[Homo sapiens]
CD2細胞質ドメイン(アミノ酸残基235~351)を太字で示す。図4に、Homo Sapiens由来の例示的なCD2ポリペプチドのアーキテクチャを示す。
「表面抗原分類2(CD2)ポリヌクレオチド」とは、CD2ポリペプチドをコードする核酸を意味する。例示的なCD2核酸配列を以下に提供する。>NM_001767.5 Homo sapiens CD2分子(CD2)、転写バリアント2、mRNA
1 agtctcactt cagttccttt tgcatgaaga gctcagaatc aaaagaggaa accaacccct
61 aagatgagct ttccatgtaa atttgtagcc agcttccttc tgattttcaa tgtttcttcc
121 aaaggtgcag tctccaaaga gattacgaat gccttggaaa cctggggtgc cttgggtcag
181 gacatcaact tggacattcc tagttttcaa atgagtgatg atattgacga tataaaatgg
241 gaaaaaactt cagacaagaa aaagattgca caattcagaa aagagaaaga gactttcaag
301 gaaaaagata catataagct atttaaaaat ggaactctga aaattaagca tctgaagacc
361 gatgatcagg atatctacaa ggtatcaata tatgatacaa aaggaaaaaa tgtgttggaa
421 aaaatatttg atttgaagat tcaagagagg gtctcaaaac caaagatctc ctggacttgt
481 atcaacacaa ccctgacctg tgaggtaatg aatggaactg accccgaatt aaacctgtat
541 caagatggga aacatctaaa actttctcag agggtcatca cacacaagtg gaccaccagc
601 ctgagtgcaa aattcaagtg cacagcaggg aacaaagtca gcaaggaatc cagtgtcgag
661 cctgtcagct gtccagagaa aggtctggac atctatctca tcattggcat atgtggagga
721 ggcagcctct tgatggtctt tgtggcactg ctcgttttct atatcaccaa aaggaaaaaa
781 cagaggagtc ggagaaatga tgaggagctg gagacaagag cccacagagt agctactgaa
841 gaaaggggcc ggaagcccca ccaaattcca gcttcaaccc ctcagaatcc agcaacttcc
901 caacatcctc ctccaccacc tggtcatcgt tcccaggcac ctagtcatcg tcccccgcct
961 cctggacacc gtgttcagca ccagcctcag aagaggcctc ctgctccgtc gggcacacaa
1021 gttcaccagc agaaaggccc gcccctcccc agacctcgag ttcagccaaa acctccccat
1081 ggggcagcag aaaactcatt gtccccttcc tctaattaaa aaagatagaa actgtctttt
1141 tcaataaaaa gcactgtgga tttctgccct cctgatgtgc atatccgtac ttccatgagg
1201 tgttttctgt gtgcagaaca ttgtcacctc ctgaggctgt gggccacagc cacctctgca
1261 tcttcgaact cagccatgtg gtcaacatct ggagtttttg gtctcctcag agagctccat
1321 cacaccagta aggagaagca atataagtgt gattgcaaga atggtagagg accgagcaca
1381 gaaatcttag agatttcttg tcccctctca ggtcatgtgt agatgcgata aatcaagtga
1441 ttggtgtgcc tgggtctcac tacaagcagc ctatctgctt aagagactct ggagtttctt
1501 atgtgccctg gtggacactt gcccaccatc ctgtgagtaa aagtgaaata aaagctttga
1561 ctaga
「表面抗原分類5(CD5)ポリペプチド」とは、NCBI受託番号NP_001333385.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_001333385.1 T細胞表面糖タンパク質CD5アイソフォーム2[Homo sapiens]
MVCSQSWGRSSKQWEDPSQASKVCQRLNCGVPLSLGPFLVTYTPQSSIICYGQLGSFSNCSHSRNDMCHSLGLTCLEPQKTTPPTTRPPPTTTPEPTAPPRLQLVAQSGGQHCAGVVEFYSGSLGGTISYEAQDKTQDLENFLCNNLQCGSFLKHLPETEAGRAQDPGEPREHQPLPIQWKIQNSSCTSLEHCFRKIKPQKSGRVLALLCSGFQPKVQSRLVGGSSICEGTVEVRQGAQWAALCDSSSARSSLRWEEVCREQQCGSVNSYRVLDAGDPTSRGLFCPHQKLSQCHELWERNSYCKKVFVTCQDPNPAGLAAGTVASIILALVLLVVLLVVCGPLAYKKLVKKFRQKKQRQWIGPTGMNQNMSFHRNHTATVRSHAENPTASHVDNEYSQPPRNSHLSAYPALEGALHRSSMQPDNSSDSDYDLHGAQRL
「表面抗原分類5(CD5)ポリヌクレオチド」とは、CD5ポリペプチドをコードする核酸を意味する。例示的なCD5核酸配列を以下に提供する。
>NM_001346456.1 Homo sapiens CD5分子(CD5)、転写バリアント2、mRNA
1 gagtcttgct gatgctcccg gctgaataaa ccccttcctt ctttaacttg gtgtctgagg
61 ggttttgtct gtggcttgtc ctgctacatt tcttggttcc ctgaccagga agcaaagtga
121 ttaacggaca gttgaggcag ccccttaggc agcttaggcc tgccttgtgg agcatccccg
181 cggggaactc tggccagctt gagcgacacg gatcctcaga gcgctcccag gtaggcaatt
241 gccccagtgg aatgcctcgt cagagcagtg catggcaggc ccctgtggag gatcaacgca
301 gtggctgaac acagggaagg aactggcact tggagtccgg acaactgaaa cttgtcgctt
361 cctgcctcgg acggctcagc tggtatgacc cagatttcca ggcaaggctc acccgttcca
421 actcgaagtg ccagggccag ctggaggtct acctcaagga cggatggcac atggtttgca
481 gccagagctg gggccggagc tccaagcagt gggaggaccc cagtcaagcg tcaaaagtct
541 gccagcggct gaactgtggg gtgcccttaa gccttggccc cttccttgtc acctacacac
601 ctcagagctc aatcatctgc tacggacaac tgggctcctt ctccaactgc agccacagca
661 gaaatgacat gtgtcactct ctgggcctga cctgcttaga accccagaag acaacacctc
721 caacgacaag gcccccgccc accacaactc cagagcccac agctcctccc aggctgcagc
781 tggtggcaca gtctggcggc cagcactgtg ccggcgtggt ggagttctac agcggcagcc
841 tggggggtac catcagctat gaggcccagg acaagaccca ggacctggag aacttcctct
901 gcaacaacct ccagtgtggc tccttcttga agcatctgcc agagactgag gcaggcagag
961 cccaagaccc aggggagcca cgggaacacc agcccttgcc aatccaatgg aagatccaga
1021 actcaagctg tacctccctg gagcattgct tcaggaaaat caagccccag aaaagtggcc
1081 gagttcttgc cctcctttgc tcaggtttcc agcccaaggt gcagagccgt ctggtggggg
1141 gcagcagcat ctgtgaaggc accgtggagg tgcgccaggg ggctcagtgg gcagccctgt
1201 gtgacagctc ttcagccagg agctcgctgc ggtgggagga ggtgtgccgg gagcagcagt
1261 gtggcagcgt caactcctat cgagtgctgg acgctggtga cccaacatcc cgggggctct
1321 tctgtcccca tcagaagctg tcccagtgcc acgaactttg ggagagaaat tcctactgca
1381 agaaggtgtt tgtcacatgc caggatccaa accccgcagg cctggccgca ggcacggtgg
1441 caagcatcat cctggccctg gtgctcctgg tggtgctgct ggtcgtgtgc ggcccccttg
1501 cctacaagaa gctagtgaag aaattccgcc agaagaagca gcgccagtgg attggcccaa
1561 cgggaatgaa ccaaaacatg tctttccatc gcaaccacac ggcaaccgtc cgatcccatg
1621 ctgagaaccc cacagcctcc cacgtggata acgaatacag ccaacctccc aggaactccc
1681 acctgtcagc ttatccagct ctggaagggg ctctgcatcg ctcctccatg cagcctgaca
1741 actcctccga cagtgactat gatctgcatg gggctcagag gctgtaaaga actgggatcc
1801 atgagcaaaa agccgagagc cagacctgtt tgtcctgaga aaactgtccg ctcttcactt
1861 gaaatcatgt ccctatttct accccggcca gaacatggac agaggccaga agccttccgg
1921 acaggcgctg ctgccccgag tggcaggcca gctcacactc tgctgcacaa cagctcggcc
1981 gcccctccac ttgtggaagc tgtggtgggc agagccccaa aacaagcagc cttccaacta
2041 gagactcggg ggtgtctgaa gggggccccc tttccctgcc cgctggggag cggcgtctca
2101 gtgaaatcgg ctttctcctc agactctgtc cctggtaagg agtgacaagg aagctcacag
2161 ctgggcgagt gcattttgaa tagttttttg taagtagtgc ttttcctcct tcctgacaaa
2221 tcgagcgctt tggcctcttc tgtgcagcat ccacccctgc ggatccctct ggggaggaca
2281 ggaaggggac tcccggagac ctctgcagcc gtggtggtca gaggctgctc acctgagcac
2341 aaagacagct ctgcacattc accgcagctg ccagccaggg gtctgggtgg gcaccaccct
2401 gacccacagc gtcaccccac tccctctgtc ttatgactcc cctccccaac cccctcatct
2461 aaagacacct tcctttccac tggctgtcaa gcccacaggg caccagtgcc acccagggcc
2521 cggcacaaag gggcgcctag taaaccttaa ccaacttggt tttttgcttc acccagcaat
2581 taaaagtccc aagctgaggt agtttcagtc catcacagtt catcttctaa cccaagagtc
2641 agagatgggg ctggtcatgt tcctttggtt tgaataactc ccttgacgaa aacagactcc
2701 tctagtactt ggagatcttg gacgtacacc taatcccatg gggcctcggc ttccttaact
2761 gcaagtgaga agaggaggtc tacccaggag cctcgggtct gatcaaggga gaggccaggc
2821 gcagctcact gcggcggctc cctaagaagg tgaagcaaca tgggaacaca tcctaagaca
2881 ggtcctttct ccacgccatt tgatgctgta tctcctggga gcacaggcat caatggtcca
2941 agccgcataa taagtctgga agagcaaaag ggagttacta ggatatgggg tgggctgctc
3001 ccagaatctg ctcagctttc tgcccccacc aacaccctcc aaccaggcct tgccttctga
3061 gagcccccgt ggccaagccc aggtcacaga tcttcccccg accatgctgg gaatccagaa
3121 acagggaccc catttgtctt cccatatctg gtggaggtga gggggctcct caaaagggaa
3181 ctgagaggct gctcttaggg agggcaaagg ttcgggggca gccagtgtct cccatcagtg
3241 ccttttttaa taaaagctct ttcatctata gtttggccac catacagtgg cctcaaagca
3301 accatggcct acttaaaaac caaaccaaaa ataaagagtt tagttgagga gaaaaaaaaa
3361 aaaaaaaaaa aaaaaa
「表面抗原分類7(CD7)ポリペプチド」とは、NCBI参照配列:NP_006128.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_006128.1 T細胞抗原CD7前駆体[Homo sapiens]
1 MAGPPRLLLL PLLLALARGL PGALAAQEVQ QSPHCTTVPV GASVNITCST SGGLRGIYLR
61 QLGPQPQDII YYEDGVVPTT DRRFRGRIDF SGSQDNLTIT MHRLQLSDTG TYTCQAITEV
121 NVYGSGTLVL VTEEQSQGWH RCSDAPPRAS ALPAPPTGSA LPDPQTASAL PDPPAASALP
181 AALAVISFLL GLGLGVACVL ARTQIKKLCS WRDKNSAACV VYEDMSHSRC NTLSSPNQYQ
「表面抗原分類7(CD7)ポリヌクレオチド」とは、CD7ポリペプチドをコードする核酸分子を意味する。例示的なCD7核酸配列を以下に提供する。
>NM_006137.7 Homo sapiens CD7分子(CD7)、mRNA
1 ctctctgagc tctgagcgcc tgcggtctcc tgtgtgctgc tctctgtggg gtcctgtaga
61 cccagagagg ctcagctgca ctcgcccggc tgggagagct gggtgtgggg aacatggccg
121 ggcctccgag gctcctgctg ctgcccctgc ttctggcgct ggctcgcggc ctgcctgggg
181 ccctggctgc ccaagaggtg cagcagtctc cccactgcac gactgtcccc gtgggagcct
241 ccgtcaacat cacctgctcc accagcgggg gcctgcgtgg gatctacctg aggcagctcg
301 ggccacagcc ccaagacatc atttactacg aggacggggt ggtgcccact acggacagac
361 ggttccgggg ccgcatcgac ttctcagggt cccaggacaa cctgactatc accatgcacc
421 gcctgcagct gtcggacact ggcacctaca cctgccaggc catcacggag gtcaatgtct
481 acggctccgg caccctggtc ctggtgacag aggaacagtc ccaaggatgg cacagatgct
541 cggacgcccc accaagggcc tctgccctcc ctgccccacc gacaggctcc gccctccctg
601 acccgcagac agcctctgcc ctccctgacc cgccagcagc ctctgccctc cctgcggccc
661 tggcggtgat ctccttcctc ctcgggctgg gcctgggggt ggcgtgtgtg ctggcgagga
721 cacagataaa gaaactgtgc tcgtggcggg ataagaattc ggcggcatgt gtggtgtacg
781 aggacatgtc gcacagccgc tgcaacacgc tgtcctcccc caaccagtac cagtgaccca
841 gtgggcccct gcacgtcccg cctgtggtcc ccccagcacc ttccctgccc caccatgccc
901 cccaccctgc cacacccctc accctgctgt cctcccacgg ctgcagcaga gtttgaaggg
961 cccagccgtg cccagctcca agcagacaca caggcagtgg ccaggcccca cggtgcttct
1021 cagtggacaa tgatgcctcc tccgggaagc cttccctgcc cagcccacgc cgccaccggg
1081 aggaagcctg actgtccttt ggctgcatct cccgaccatg gccaaggagg gcttttctgt
1141 gggatgggcc tgggcacgcg gccctctcct gtcagtgccg gcccacccac cagcaggccc
1201 ccaaccccca ggcagcccgg cagaggacgg gaggagacca gtcccccacc cagccgtacc
1261 agaaataaag gcttctgtgc ttcc
「表面抗原分類33(CD33)ポリペプチド」とは、NCBI参照配列:NP_001763.3またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。CD33は、Siglec-3としても知られている。例示的なアミノ酸配列を以下に提供する。
>NP_001763.3 骨髄細胞表面抗原CD33アイソフォーム1前駆体[Homo sapiens]
1 MPLLLLLPLL WAGALAMDPN FWLQVQESVT VQEGLCVLVP CTFFHPIPYY DKNSPVHGYW
61 FREGAIISRD SPVATNKLDQ EVQEETQGRF RLLGDPSRNN CSLSIVDARR RDNGSYFFRM
121 ERGSTKYSYK SPQLSVHVTD LTHRPKILIP GTLEPGHSKN LTCSVSWACE QGTPPIFSWL
181 SAAPTSLGPR TTHSSVLIIT PRPQDHGTNL TCQVKFAGAG VTTERTIQLN VTYVPQNPTT
241 GIFPGDGSGK QETRAGVVHG AIGGAGVTAL LALCLCLIFF IVKTHRRKAA RTAVGRNDTH
301 PTTGSASPKH QKKSKLHGPT ETSSCSGAAP TVEMDEELHY ASLNFHGMNP SKDTSTEYSE
361 VRTQ
「表面抗原分類33(CD33)ポリヌクレオチド」とは、CD33ポリペプチドをコードする核酸分子を意味する。例示的なCD33核酸配列を以下に提供する。
>NM_001772.4 Homo sapiens CD33分子(CD33)、転写バリアント1、mRNA
1 ctgctcacac aggaagccct ggaagctgct tcctcagaca tgccgctgct gctactgctg
61 cccctgctgt gggcaggggc cctggctatg gatccaaatt tctggctgca agtgcaggag
121 tcagtgacgg tacaggaggg tttgtgcgtc ctcgtgccct gcactttctt ccatcccata
181 ccctactacg acaagaactc cccagttcat ggttactggt tccgggaagg agccattata
241 tccagggact ctccagtggc cacaaacaag ctagatcaag aagtacagga ggagactcag
301 ggcagattcc gcctccttgg ggatcccagt aggaacaact gctccctgag catcgtagac
361 gccaggagga gggataatgg ttcatacttc tttcggatgg agagaggaag taccaaatac
421 agttacaaat ctccccagct ctctgtgcat gtgacagact tgacccacag gcccaaaatc
481 ctcatccctg gcactctaga acccggccac tccaaaaacc tgacctgctc tgtgtcctgg
541 gcctgtgagc agggaacacc cccgatcttc tcctggttgt cagctgcccc cacctccctg
601 ggccccagga ctactcactc ctcggtgctc ataatcaccc cacggcccca ggaccacggc
661 accaacctga cctgtcaggt gaagttcgct ggagctggtg tgactacgga gagaaccatc
721 cagctcaacg tcacctatgt tccacagaac ccaacaactg gtatctttcc aggagatggc
781 tcagggaaac aagagaccag agcaggagtg gttcatgggg ccattggagg agctggtgtt
841 acagccctgc tcgctctttg tctctgcctc atcttcttca tagtgaagac ccacaggagg
901 aaagcagcca ggacagcagt gggcaggaat gacacccacc ctaccacagg gtcagcctcc
961 ccgaaacacc agaagaagtc caagttacat ggccccactg aaacctcaag ctgttcaggt
1021 gccgccccta ctgtggagat ggatgaggag ctgcattatg cttccctcaa ctttcatggg
1081 atgaatcctt ccaaggacac ctccaccgaa tactcagagg tcaggaccca gtgaggaacc
1141 cacaagagca tcaggctcag ctagaagatc cacatcctct acaggtcggg gaccaaaggc
1201 tgattcttgg agatttaaca ccccacaggc aatgggttta tagacattat gtgagtttcc
1261 tgctatatta acatcatctt agactttgca agcagagagt cgtggaatca aatctgtgct
1321 ctttcatttg ctaagtgtat gatgtcacac aagctcctta accttccatg tctccatttt
1381 cttctctgtg aagtaggtat aagaagtcct atctcatagg gatgctgtga gcattaaata
1441 aaggtacaca tggaaaacac ca
「表面抗原分類52(CD52)ポリペプチド」とは、NCBI参照配列:NP_001794.2またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。CD52は、CAMPATH-1としても知られている。例示的なアミノ酸配列を以下に提供する。
>NP_001794.2 CAMPATH-1抗原前駆体[Homo sapiens]
1 MKRFLFLLLT ISLLVMVQIQ TGLSGQNDTS QTSSPSASSN ISGGIFLFFV ANAIIHLFCF
61 S
「表面抗原分類52(CD52)ポリヌクレオチド」とは、CD52ポリペプチドをコードする核酸分子を意味する。例示的なCD52核酸配列を以下に提供する。
>NM_001803.3 Homo sapiens CD52分子(CD52)、mRNA
1 agacagccct gagatcacct aaaaagctgc taccaagaca gccacgaaga tcctaccaaa
61 atgaagcgct tcctcttcct cctactcacc atcagcctcc tggttatggt acagatacaa
121 actggactct caggacaaaa cgacaccagc caaaccagca gcccctcagc atccagcaac
181 ataagcggag gcattttcct tttcttcgtg gccaatgcca taatccacct cttctgcttc
241 agttgaggtg acacgtctca gccttagccc tgtgccccct gaaacagctg ccaccatcac
301 tcgcaagaga atcccctcca tctttgggag gggttgatgc cagacatcac caggttgtag
361 aagttgacag gcagtgccat gggggcaaca gccaaaatag gggggtaatg atgtaggggc
421 caagcagtgc ccagctgggg gtcaataaag ttacccttgt acttgca
「表面抗原分類123(CD123)ポリペプチド」とは、NCBI参照配列:NP_002174.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。CD123は、インターロイキン-3受容体としても知られている。例示的なアミノ酸配列を以下に提供する。
>NP_002174.1インターロイキン-3受容体サブユニットαアイソフォーム1前駆体[Homo sapiens]
1 MVLLWLTLLL IALPCLLQTK EDPNPPITNL RMKAKAQQLT WDLNRNVTDI ECVKDADYSM
61 PAVNNSYCQF GAISLCEVTN YTVRVANPPF STWILFPENS GKPWAGAENL TCWIHDVDFL
121 SCSWAVGPGA PADVQYDLYL NVANRRQQYE CLHYKTDAQG TRIGCRFDDI SRLSSGSQSS
181 HILVRGRSAA FGIPCTDKFV VFSQIEILTP PNMTAKCNKT HSFMHWKMRS HFNRKFRYEL
241 QIQKRMQPVI TEQVRDRTSF QLLNPGTYTV QIRARERVYE FLSAWSTPQR FECDQEEGAN
301 TRAWRTSLLI ALGTLLALVC VFVICRRYLV MQRLFPRIPH MKDPIGDSFQ NDKLVVWEAG
361 KAGLEECLVT EVQVVQKT
「表面抗原分類123(CD123)ポリヌクレオチド」とは、CD123ポリペプチドをコードする核酸分子を意味する。例示的なCD123核酸配列を以下に提供する。
>NM_002183.4 Homo sapiensインターロイキン3受容体サブユニットα(IL3RA)、転写バリアント1、mRNA
1 cttcggtttc tcttcgggga aagctgcttt cagcgcacac gggaagatat cagaaacatc
61 ctaggatcag gacaccccag atcttctcaa ctggaaccac gaaggctgtt tcttccacac
121 agtactttga tctccattta agcaggcacc tctgtcctgc gttccggagc tgcgttcccg
181 atggtcctcc tttggctcac gctgctcctg atcgccctgc cctgtctcct gcaaacgaag
241 gaagatccaa acccaccaat cacgaaccta aggatgaaag caaaggctca gcagttgacc
301 tgggacctta acagaaatgt gaccgatatc gagtgtgtta aagacgccga ctattctatg
361 ccggcagtga acaatagcta ttgccagttt ggagcaattt ccttatgtga agtgaccaac
421 tacaccgtcc gagtggccaa cccaccattc tccacgtgga tcctcttccc tgagaacagt
481 gggaagcctt gggcaggtgc ggagaatctg acctgctgga ttcatgacgt ggatttcttg
541 agctgcagct gggcggtagg cccgggggcc cccgcggacg tccagtacga cctgtacttg
601 aacgttgcca acaggcgtca acagtacgag tgtcttcact acaaaacgga tgctcaggga
661 acacgtatcg ggtgtcgttt cgatgacatc tctcgactct ccagcggttc tcaaagttcc
721 cacatcctgg tgcggggcag gagcgcagcc ttcggtatcc cctgcacaga taagtttgtc
781 gtcttttcac agattgagat attaactcca cccaacatga ctgcaaagtg taataagaca
841 cattccttta tgcactggaa aatgagaagt catttcaatc gcaaatttcg ctatgagctt
901 cagatacaaa agagaatgca gcctgtaatc acagaacagg tcagagacag aacctccttc
961 cagctactca atcctggaac gtacacagta caaataagag cccgggaaag agtgtatgaa
1021 ttcttgagcg cctggagcac cccccagcgc ttcgagtgcg accaggagga gggcgcaaac
1081 acacgtgcct ggcggacgtc gctgctgatc gcgctgggga cgctgctggc cctggtctgt
1141 gtcttcgtga tctgcagaag gtatctggtg atgcagagac tctttccccg catccctcac
1201 atgaaagacc ccatcggtga cagcttccaa aacgacaagc tggtggtctg ggaggcgggc
1261 aaagccggcc tggaggagtg tctggtgact gaagtacagg tcgtgcagaa aacttgagac
1321 tggggttcag ggcttgtggg ggtctgcctc aatctccctg gccgggccag gcgcctgcac
1381 agactggctg ctggacctgc gcacgcagcc caggaatgga cattcctaac gggtggtggg
1441 catgggagat gcctgtgtaa tttcgtccga agctgccagg aagaagaaca gaactttgtg
1501 tgtttatttc atgataaagt gatttttttt tttttaaccc a
「表面抗原分類137(CD137)ポリペプチド」とは、NCBI参照配列:NP_001552.2またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。CD137は、4-1BBとしても知られている。例示的なアミノ酸配列を以下に提供する。
>NP_001552.2 腫瘍壊死因子受容体スーパーファミリーメンバー9前駆体[Homo sapiens]
1 MGNSCYNIVA TLLLVLNFER TRSLQDPCSN CPAGTFCDNN RNQICSPCPP NSFSSAGGQR
61 TCDICRQCKG VFRTRKECSS TSNAECDCTP GFHCLGAGCS MCEQDCKQGQ ELTKKGCKDC
121 CFGTFNDQKR GICRPWTNCS LDGKSVLVNG TKERDVVCGP SPADLSPGAS SVTPPAPARE
181 PGHSPQIISF FLALTSTALL FLLFFLTLRF SVVKRGRKKL LYIFKQPFMR PVQTTQEEDG
241 CSCRFPEEEE GGCEL
「表面抗原分類137(CD137)ポリヌクレオチド」とは、CD137ポリペプチドをコードする核酸分子を意味する。例示的なCD137核酸配列を以下に提供する。
>NM_001561.6 Homo sapiens TNF受容体スーパーファミリーメンバー9(TNFRSF9)、mRNA
1 gcagaagcct gaagaccaag gagtggaaag ttctccggca gccctgagat ctcaagagtg
61 acatttgtga gaccagctaa tttgattaaa attctcttgg aatcagcttt gctagtatca
121 tacctgtgcc agatttcatc atgggaaaca gctgttacaa catagtagcc actctgttgc
181 tggtcctcaa ctttgagagg acaagatcat tgcaggatcc ttgtagtaac tgcccagctg
241 gtacattctg tgataataac aggaatcaga tttgcagtcc ctgtcctcca aatagtttct
301 ccagcgcagg tggacaaagg acctgtgaca tatgcaggca gtgtaaaggt gttttcagga
361 ccaggaagga gtgttcctcc accagcaatg cagagtgtga ctgcactcca gggtttcact
421 gcctgggggc aggatgcagc atgtgtgaac aggattgtaa acaaggtcaa gaactgacaa
481 aaaaaggttg taaagactgt tgctttggga catttaacga tcagaaacgt ggcatctgtc
541 gaccctggac aaactgttct ttggatggaa agtctgtgct tgtgaatggg acgaaggaga
601 gggacgtggt ctgtggacca tctccagccg acctctctcc gggagcatcc tctgtgaccc
661 cgcctgcccc tgcgagagag ccaggacact ctccgcagat catctccttc tttcttgcgc
721 tgacgtcgac tgcgttgctc ttcctgctgt tcttcctcac gctccgtttc tctgttgtta
781 aacggggcag aaagaaactc ctgtatatat tcaaacaacc atttatgaga ccagtacaaa
841 ctactcaaga ggaagatggc tgtagctgcc gatttccaga agaagaagaa ggaggatgtg
901 aactgtgaaa tggaagtcaa tagggctgtt gggactttct tgaaaagaag caaggaaata
961 tgagtcatcc gctatcacag ctttcaaaag caagaacacc atcctacata atacccagga
1021 ttcccccaac acacgttctt ttctaaatgc caatgagttg gcctttaaaa atgcaccact
1081 tttttttttt ttttgacagg gtctcactct gtcacccagg ctggagtgca gtggcaccac
1141 catggctctc tgcagccttg acctctggga gctcaagtga tcctcctgcc tcagtctcct
1201 gagtagctgg aactacaagg aagggccacc acacctgact aacttttttg ttttttgttt
1261 ggtaaagatg gcatttcacc atgttgtaca ggctggtctc aaactcctag gttcactttg
1321 gcctcccaaa gtgctgggat tacagacatg aactgccagg cccggccaaa ataatgcacc
1381 acttttaaca gaacagacag atgaggacag agctggtgat aaaaaaaaaa aaaaaaaagc
1441 attttctaga taccacttaa caggtttgag ctagtttttt tgaaatccaa agaaaattat
1501 agtttaaatt caattacata gtccagtggt ccaactataa ttataatcaa aatcaatgca
1561 ggtttgtttt ttggtgctaa tatgacatat gacaataagc cacgaggtgc agtaagtacc
1621 cgactaaagt ttccgtgggt tctgtcatgt aacacgacat gctccaccgt caggggggag
1681 tatgagcaga gtgcctgagt ttagggtcaa ggacaaaaaa cctcaggcct ggaggaagtt
1741 ttggaaagag ttcaagtgtc tgtatatcct atggtcttct ccatcctcac accttctgcc
1801 tttgtcctgc tcccttttaa gccaggttac attctaaaaa ttcttaactt ttaacataat
1861 attttatacc aaagccaata aatgaactgc atatgatagg tatgaagtac agtgagaaaa
1921 ttaacacctg tgagctcatt gtcctaccac agcactagag tgggggccgc caaactccca
1981 tggccaaacc tggtgcacca tttgcctttg tttgtctgtt ggtttgcttg agacagtctt
2041 gctctgttgc ccaggctgga atggagtggc tattcacagg cacaatcata gcacacttta
2101 gccttaaact cctgggctca agtgatccac ccgcctcagt ctcccaagta gctgggatta
2161 caggtgcaaa cctggcatgc ctgccattgt ttggcttatg atctaaggat agctttttaa
2221 attttattca ttttattttt ttttgagaca gtgtctcact ctgtctccca ggctggagta
2281 cagtggtaca atcttggatc accgcctccc agtttcaagt gatctccctg cctcagcctc
2341 ctaagtagct gggactacag gtatgtgcca ccacgcctgg ctaattttta tatttttagt
2401 agagacgggg tttcaccatg ttgtccaggc tggtctcaaa ctcctgacct caggtgatct
2461 gcccacctct gcctcccaaa gtgctgggat tacaggcatg agccaccatg cctggccatt
2521 tcttacactt ttgtatgaca tgcctattgc aagcttgcgt gcctctgtcc catgttattt
2581 tactctggga tttaggtgga gggagcagct tctatttgga acattggcca tcgcatggca
2641 aatgggtatc tgtcacttct gctcctattt agttggttct actataacct ttagagcaaa
2701 tcctgcagcc aagccaggca tcaatagggc agaaaagtat attctgtaaa taggggtgag
2761 gagaagatat ttctgaacaa tagtctactg cagtaccaaa ttgcttttca aagtggctgt
2821 tctaatgtac tcccgtcagt catataagtg tcatgtaagt atcccattga tccacatcct
2881 tgctaccctc tggtactatc aggtgccctt aattttgcca agccagtggg tatagaatga
2941 gatctcactg tggtcttagt ttgcatttgc ttggttactg atgagcacct tgtcaaatat
3001 ttatatacca tttgtgttta tttttttaaa taaaatgctt gctcatgctt ttttgcccat
3061 ttgcaaaaaa acttggggcc gggtgcagtg gctcatgcct gtagtcccag ctctttggga
3121 ggccaaggtg ggcagatcgc ttgagcccag gagttcgaga ccagccttgg caacatggcg
3181 aaaccctgtc tttacaaaaa atacaaaaat tagccgggtg tggtggtgtg cacctgaagt
3241 cccagctact cagtaggttc gctttgagcc tgggaggcag aggttgcagt gagctgggac
3301 cgcatcacta cacttcagcc tgggcaacag agaaaaacct tttctcagaa acaaacaaac
3361 ccaaatgtgg ttgtttgtcc tgattcctaa aaggtcttta tgtattctag ataataatct
3421 ttggtcagtt atatgtgtta aaaaatatct tctttgtggc caggcacggt agctcacacc
3481 tgtaatccca gcactttgcg gggctgaggt gggtggatca tctgaggtca agagttcaag
3541 atcagcctgg ccaacacagt gaaaccccat ctctactaaa catgtacaaa acttagctgg
3601 gtatggtggc gggtgcctgt aaccccagct gctccagagg ctgtggcaga agaatcgctt
3661 gaacccagga ggcagaggtt gcagcgagcc aagattgtgc cattgcactc cagactgggt
3721 gacaagagtg aaattctgcc tatctatcta tctatctatc tatatctata tatatatata
3781 tatatatcct ttgtaattta tttttccctt tttaaaattt tttataaaat tcttttttat
3841 ttttattttt agcagaggtg aggtttctga ggtttcatta tgttgcccag gctggtcttg
3901 aactcctgag ctcaagtgat cctcccacct cagccttcca aagtgctgga attgcagaca
3961 tgagccaccg cgcccctcct gtttttctct aattaatggt gtctttcttt gtctttctgg
4021 taataagcaa aaagttcttc atttgatttg gttaaattta taactgtttt ctcatatggt
4081 taacattttt tcttgcctgg ctaaagaaat ccttttctgc ccaatactat aaagaggttt
4141 gcccacattt tattccaaaa gttttaagtt ttgtctttca tcttgaagtc taatgtatca
4201 ggaactggct tttgtgcctg ttgggaggta gtgatccaat tccatgtctt gcatgtaggt
4261 aaccactggt ccctgcgcca tgtattcaat acgtcgtctt tctcctgcgg gtctgcaatc
4321 tcacctacca tccatcaagt ttccataggg ccatgggtct gcttctgggc tccctgttct
4381 gttccattgt caatttgtct atcctgtgcc agtatcacac tgtgtttatt acaatagctt
4441 tgtaacagct ctcgatatcc ggtaggacat ctccctccac cttctttttc tacttcagaa
4501 gtgtcttagc taggtcaggc acggtggctc acgcctgtaa tcccagcact ttgggaggcc
4561 gacgcggatg gatcacctga ggtcaggagt tttgagacag cctggccaac atggtgaaac
4621 cccatctcta ctaaaaaata caaaaattag tcaggcatgg tggcatgtgc ctgtaatccc
4681 agctatttgg gaggctgagg ccggagaatt gcttgaaccc ggggggcgga ggttgcagtg
4741 agccgagatc gtaccattgc actccagcct gggtgacaga gcgaaactct gtctcaggaa
4801 aaaaaagaaa agagatgtct tggttattct tggttcttta ttattcaata taaattttag
4861 aagctgaatt tgaaaagatt tggattggaa tttcattaaa tctacaggtc aatttaggga
4921 gagttgataa ttttacagaa ttgagtcatc tggtgttcca ataagaataa gagaacaatt
4981 attggctgta caattcttgc caaatagtag gcaaagcaaa gcttaggaag tatactggtg
5041 ccatttcagg aacaaagcta ggtgcgaata tttttgtctt tctgaatcat gatgctgtaa
5101 gttctaaagt gatttctcct cttggctttg gacacatggt gtttaattac ctactgctga
5161 ctatccacaa acagaaagag actggtcatg ccccacaggg ttggggtatc caagataatg
5221 gagcgaggct ctcatgtgtc ctaggttaca caccgaaaat ccacagttta ttctgtgaag
5281 aaaggaggct atgtttatga tacagactgt gatattttta tcatagccta ttctggtatc
5341 atgtgcaaaa gctataaatg aaaaacacag gaacttggca tgtgagtcat tgctccccct
5401 aaatgacaat taataaggaa ggaacattga gacagaataa aatgatcccc ttctgggttt
5461 aatttagaaa gttccataat taggtttaat agaaataaat gtaaatttct atgattaaaa
5521 ataaattagc acatttaggg atacacaaat tataaatcat tttctaaatg ctaaaaacaa
5581 gctcaggttt ttttcagaag aaagttttaa ttttttttct ttagtggaag atatcactct
5641 gacggaaagt tttgatgtga ggggcggatg actataaagt gggcatcttc ccccacagga
5701 agatgtttcc atctgtgggt gagaggtgcc caccgcagct agggcaggtt acatgtgccc
5761 tgtgtgtggt aggacttgga gagtgatctt tatcaacgtt tttatttaaa agactatcta
5821 ataaaacaca aaactatgat gttcacagga aaaaaagaat aagaaaaaaa ga
「表面抗原分類247(CD247)ポリペプチド」とは、NCBI参照配列:NP_932170.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。CD137は、CD3ζとしても知られている。例示的なアミノ酸配列を以下に提供する。
>NP_932170.1 T細胞表面糖タンパク質CD3ζ鎖アイソフォーム1前駆体[Homo sapiens]
1 MKWKALFTAA ILQAQLPITE AQSFGLLDPK LCYLLDGILF IYGVILTALF LRVKFSRSAD
61 APAYQQGQNQ LYNELNLGRR EEYDVLDKRR GRDPEMGGKP QRRKNPQEGL YNELQKDKMA
121 EAYSEIGMKG ERRRGKGHDG LYQGLSTATK DTYDALHMQA LPPR
「表面抗原分類247(CD247)ポリヌクレオチド」とは、CD247ポリペプチドをコードする核酸分子を意味する。例示的なCD247核酸配列を以下に提供する。
>NM_NM_198053.3 Homo sapiens CD247分子(CD247)、転写バリアント1、mRNA
1 aaccgtcccg gccaccgctg cctcagcctc tgcctcccag cctctttctg agggaaagga
61 caagatgaag tggaaggcgc ttttcaccgc ggccatcctg caggcacagt tgccgattac
121 agaggcacag agctttggcc tgctggatcc caaactctgc tacctgctgg atggaatcct
181 cttcatctat ggtgtcattc tcactgcctt gttcctgaga gtgaagttca gcaggagcgc
241 agacgccccc gcgtaccagc agggccagaa ccagctctat aacgagctca atctaggacg
301 aagagaggag tacgatgttt tggacaagag acgtggccgg gaccctgaga tggggggaaa
361 gccgcagaga aggaagaacc ctcaggaagg cctgtacaat gaactgcaga aagataagat
421 ggcggaggcc tacagtgaga ttgggatgaa aggcgagcgc cggaggggca aggggcacga
481 tggcctttac cagggtctca gtacagccac caaggacacc tacgacgccc ttcacatgca
541 ggccctgccc cctcgctaac agccagggga tttcaccact caaaggccag acctgcagac
601 gcccagatta tgagacacag gatgaagcat ttacaacccg gttcactctt ctcagccact
661 gaagtattcc cctttatgta caggatgctt tggttatatt tagctccaaa ccttcacaca
721 cagactgttg tccctgcact ctttaaggga gtgtactccc agggcttacg gccctggcct
781 tgggccctct ggtttgccgg tggtgcaggt agacctgtct cctggcggtt cctcgttctc
841 cctgggaggc gggcgcactg cctctcacag ctgagttgtt gagtctgttt tgtaaagtcc
901 ccagagaaag cgcagatgct agcacatgcc ctaatgtctg tatcactctg tgtctgagtg
961 gcttcactcc tgctgtaaat ttggcttctg ttgtcacctt cacctccttt caaggtaact
1021 gtactgggcc atgttgtgcc tccctggtga gagggccggg cagaggggca gatggaaagg
1081 agcctaggcc aggtgcaacc agggagctgc aggggcatgg gaaggtgggc gggcagggga
1141 gggtcagcca gggcctgcga gggcagcggg agcctccctg cctcaggcct ctgtgccgca
1201 ccattgaact gtaccatgtg ctacaggggc cagaagatga acagactgac cttgatgagc
1261 tgtgcacaaa gtggcataaa aaacatgtgg ttacacagtg tgaataaagt gctgcggagc
1321 aagaggaggc cgttgattca cttcacgctt tcagcgaatg acaaaatcat ctttgtgaag
1381 gcctcgcagg aagacccaac acatgggacc tataactgcc cagcggacag tggcaggaca
1441 ggaaaaaccc gtcaatgtac taggatactg ctgcgtcatt acagggcaca ggccatggat
1501 ggaaaacgct ctctactctg ctttttttct actgttttaa tttatactgg catgctaaag
1561 ccttcctatt ttgcataata aatgcttcag tgaaaatgca
「同時投与」または「同時投与された」とは、治療過程で2つ以上の治療剤または薬学的組成物を投与することを指す。かかる同時投与は、同時投与または逐次投与であり得る。後で投与される治療剤または薬学的組成物の逐次投与は、第1の薬学的組成物または治療剤の投与後、治療過程の任意の時点で行われ得る。
「保存的アミノ酸置換」または「保存的変異」という用語は、1つのアミノ酸が、共通の特性を有する別のアミノ酸に置換されることを指す。個々のアミノ酸間の共通の特性を定義する機能的な方法は、類似の生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz,G.E.and Schirmer,R.H.,Principles of Protein Structure,Springer-Verlag,New York(1979))。このような分析に従って、アミノ酸のグループは、グループ内のアミノ酸が互いに優先的に交換され、したがって、タンパク質構造全体に対するそれらの影響が互いに最も類似している場合に、定義され得る(Schulz,G.E.and Schirmer,R.H.、上記)。保存的変異の非限定的な例としては、アミノ酸のアミノ酸置換(例えば、正電荷が維持され得るようにアルギニンに対してリジン、またはその逆、負電荷が維持され得るようにアスパラギン酸に対してグルタミン酸、またはその逆、遊離-OHが維持され得るようにスレオニンに対してセリン、および遊離-NHが維持され得るようにアスパラギンに対してグルタミン)が挙げられる。
「コード配列」または「タンパク質コード配列」という用語は、本明細書で互換的に使用され、タンパク質をコードするポリヌクレオチドのセグメントを指す。領域または配列は、5’末端により近い開始コドンによって、および3’末端により近い終止コドンによって境界付けられる。コード配列は、オープンリーディングフレームとも称され得る。
「コドン最適化」とは、天然配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50、または以上のコドン)において、天然アミノ酸配列を維持しながら、その宿主細胞の遺伝子でより頻繁にまたは最も頻繁に使用されるコドンで置換することによって、目的の宿主細胞における発現を向上させるための核酸配列を修飾するプロセスを意味する。様々な種は、特定のアミノ酸の特定のコドンに対して特定のバイアスを示す。コドンバイアス(生物間のコドン使用の差異)は、多くの場合、メッセンジャーRNA(mRNA)の翻訳の効率と相関し、これは次いで、とりわけ、翻訳されるコドンの特性および特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられている。細胞において選択されるtRNAの優位性は、概して、ペプチド合成で最も頻繁に使用されるコドンを反映している。したがって、遺伝子は、コドン最適化に基づいて所与の生物における最適な遺伝子発現のために調整され得る。コドン使用率表は、例えば、www.kazusa.orjp/codon/(2002年7月9日に参照)で入手可能な「コドン使用率データベース」で容易に入手可能であり、これらの表は、いくつかの方法で適合され得る。Nakamura,Y.,et al.“Codon usage tabulated from the international DNA sequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)を参照されたい。特定の宿主細胞における発現のために特定の配列を最適化するためのコドンに関するコンピュータアルゴリズムも利用可能であり、例えば、Gene Forge(Aptagen;Jacobus,Pa.)も利用可能である。一部の実施形態では、操作されたヌクレアーゼをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50、もしくはそれ以上のコドン、またはすべてのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒し得るポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinusに由来するPmCDA1(Petromyzon marinusシトシンデアミナーゼ1(「PmCDA1」))、または哺乳動物(例えば、ヒト、ブタ、ウシ、ウマ、サルなど)に由来するAID(活性化誘導シチジンデアミナーゼ(「AICDA」))、およびAPOBECは、例示的なシチジンデアミナーゼである。
PmCDA1の塩基配列およびアミノ酸配列、ならびにヒトAIDの塩基配列およびアミノ酸配列を以下に示す。
>tr|A5H718|A5H718_PETMA シトシンデアミナーゼ OS=Petromyzon marinus OX=7757 PE=2 SV=1ヤツメウナギ
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
>EF094822.1 Petromyzon marinus 単離体PmCDA.21シトシンデアミナーゼmRNA、完全長CDS
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
>tr|Q6QJ80|Q6QJ80_HUMAN 活性化誘導シチジンデアミナーゼ OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV
>NG_011588.1:5001-15681 Homo sapiens活性化誘導シチジンデアミナーゼ(AICDA)、12番染色体上のRefSeqGene(LRG_17)
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGAC

TGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGAG

CAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様(APOBEC)は、進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUの編集酵素である。APOBEC様タンパク質のN末端ドメインは、触媒ドメインであり、C末端ドメインは、偽触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(現在、「APOBEC3E」は、これを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導(シチジン)デアミナーゼが含まれる。多くの修飾シチジンデアミナーゼが市販されており、これらに限定されないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3が挙げられ、これらは、Addgeneから入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。
本開示の態様によるCas9に融合され得る他の例示的なデアミナーゼが本明細書に提供される。一部の実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナルがないドメイン(核局在化配列、核輸送シグナルなし、細胞質局在化シグナル)が使用され得ることを理解されたい。
「デアミナーゼ」または「デアミナーゼドメイン」という用語は、本明細書で使用される場合、脱アミノ化反応を触媒するタンパク質または酵素を指す。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、シチジンデアミナーゼであり、シチジンまたはデオキシシチジンを、それぞれウリジンまたはデオキシウリジンに加水分解的に脱アミノ化するのを触媒する。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、シトシンデアミナーゼであり、シトシンのウラシルへの加水分解的な脱アミノ化を触媒する。一部の実施形態では、デアミナーゼは、アデノシンデアミナーゼであり、アデニンのヒポキサンチンへの加水分解的な脱アミノ化を触媒する。一部の実施形態では、デアミナーゼは、アデノシンデアミナーゼであり、アデノシンまたはアデニン(A)のイノシン(I)への加水分解的な脱アミノ化を触媒する。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、アデノシンまたはデオキシアデノシンを、それぞれイノシンまたはデオキシイノシンに加水分解的に脱アミノ化するのを触媒する。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)のアデノシンの加水分解的な脱アミノ化を触媒する。本明細書に提供されるアデノシンデアミナーゼ(例えば、操作されたアデノシンデアミナーゼ、進化したアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。一部の実施形態では、アデノシンデアミナーゼは、細菌(例えば、Escherichia coli、Staphylococcus aureus、Salmonella typhimurium、Shewanella putrefaciens、Haemophilus influenzae、またはCaulobacter crescentus)由来である。
一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然に存在するデアミナーゼのバリアントである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在しない。例えば、一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼと、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。
例えば、デアミナーゼドメインは、国際PCT出願第2017/045381号(WO2018/027078)およびPCT/US2016/058344号(WO2017/070632)に記載される(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)、およびRees,H.A.,et al.,“Base editing:precision chemistry on the genome and transcriptome of living cells.”Nat Rev Genet.2018 Dec;19(12):770-788.doi:10.1038/s41576-018-0059-1も参照されたい(その内容全体が、参照により本明細書に援用される)。
「検出する」とは、検出される分析物の存在、不在、または量を特定することを指す。
「検出可能な標識」とは、目的の分子に連結された場合、分光学的、光化学的、生化学的、免疫化学的、または化学的な手段を介して、目的の分子を検出可能にする組成物を意味する。例えば、有用な標識としては、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素結合免疫吸着アッセイ(ELISA)で一般的に使用される酵素)、ビオチン、ジゴキシゲニン、またはハプテンが挙げられる。
「疾患」とは、細胞、組織、または器官の正常な機能を損傷または妨害する任意の状態または障害を意味する。一実施形態では、疾患は、腫瘍またはがんである。一部の実施形態では、疾患は、血液がんである。「血液がん」とは、免疫系細胞の悪性腫瘍を意味する。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。リンパ腫および白血病は、血液中に存在する「液体がん」またはがんの例であり、骨髄中の造血前駆細胞または血液中の成熟造血細胞のいずれかの形質転換に由来する。白血病は、リンパ系または骨髄系、ならびに急性または慢性であり得る。骨髄腫の場合、形質転換細胞は、完全に分化した形質細胞であり、悪性細胞の分散集合体として、または骨髄中の固体塊として存在し得る。リンパ腫の場合、二次リンパ組織中の形質転換リンパ球は、固体塊を生成する。リンパ腫は、ホジキンリンパ腫(HL)または非ホジキンリンパ腫(NHL)のいずれかに分類される。
一部の実施形態では、血液がんは、B細胞がんである。一部の実施形態では、B細胞がんは、リンパ腫または白血病である。場合によっては、白血病は、前白血病を含む。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。
疾患の非限定的な例としては、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫が挙げられる。一部の実施形態では、疾患は、液体腫瘍である。一部の実施形態では、疾患は、T細胞急性リンパ芽球性白血病(T-ALL)である。一部の実施形態では、疾患は、急性骨髄性白血病(AML)である。
本明細書で使用される「有効量」という用語は、所望の生物学的応答を誘発するのに十分な生物学的活性剤の量を指す。一部の実施形態では、有効量は、未治療の患者と比較して、疾患の症状を緩和するのに必要な量である。疾患の治療的処置のために本発明を実施するために使用される活性剤の有効量は、投与方法、対象の年齢、体重、および全般的な健康状態に応じて変化する。最終的には、主治医または獣医が適切な量と投薬レジメンを決定する。このような量は、「有効」量と称される。一実施形態では、有効量は、細胞(例えば、細胞インビトロまたはインビボ)における目的の遺伝子の変化を導入するのに十分な本発明の塩基エディター(例えば、プログラマブルDNA結合タンパク質、核酸塩基エディター、およびgRNAを含む融合タンパク質)の量である。一実施形態では、有効量は、治療効果を達成するために(例えば、疾患またはその症状もしくは状態を低減または制御するために)必要とされる塩基エディターの量である。かかる治療効果は、対象、組織、または器官のすべての細胞で目的の遺伝子が改変されるのに十分である必要はなく、対象、組織、または器官に存在する細胞の約1%、5%、10%、25%、50%、75%、またはそれ以上で目的の遺伝子が改変されるだけでよい。
一部の実施形態では、本明細書に提供される融合タンパク質(例えば、nCas9ドメインおよびデアミナーゼドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)を含む核酸塩基エディター)の有効量は、本明細書に記載の核酸塩基エディターによって特異的に結合および編集される標的部位の編集を誘導するのに十分な融合タンパク質の量を指す。当業者によって理解されるように、薬剤(例えば、融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質(またはタンパク質二量体)とポリヌクレオチドの複合体、またはポリヌクレオチド)の有効量は、様々な要因(例えば、所望の生物学的応答、例えば、編集される特定のアレル、ゲノム、もしくは標的部位、標的となる細胞もしくは組織、および/または使用される薬剤など)に応じて変化し得る。CAR-T細胞の文脈において、「有効量」とは、治療応答を達成するために、患者に投与するのに必要な細胞の量を指す。
本明細書で使用される「エピトープ」とは、抗原決定基を意味する。エピトープは、抗原分子の一部であり、その構造によって、エピトープを認識し、それに結合する特異的な抗体分子が決定される。
「Fas細胞表面細胞死受容体(FAS)ポリペプチド」とは、NCBI受託番号NP_000034.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_000034.1 腫瘍壊死因子受容体スーパーファミリーメンバー6アイソフォーム1前駆体[Homo sapiens]
1 MLGIWTLLPL VLTSVARLSS KSVNAQVTDI NSKGLELRKT VTTVETQNLE GLHHDGQFCH
61 KPCPPGERKA RDCTVNGDEP DCVPCQEGKE YTDKAHFSSK CRRCRLCDEG HGLEVEINCT
121 RTQNTKCRCK PNFFCNSTVC EHCDPCTKCE HGIIKECTLT SNTKCKEEGS RSNLGWLCLL
181 LLPIPLIVWV KRKEVQKTCR KHRKENQGSH ESPTLNPETV AINLSDVDLS KYITTIAGVM
241 TLSQVKGFVR KNGVNEAKID EIKNDNVQDT AEQKVQLLRN WHQLHGKKEA YDTLIKDLKK
301 ANLCTLAEKI QTIILKDITS DSENSNFRNE IQSLV
「Fas細胞表面細胞死受容体(FAS)ポリヌクレオチド」とは、FASポリペプチドをコードする核酸を意味する。例示的なFAS核酸配列を以下に提供する。
>NM_000043.6 Homo sapiens Fas細胞表面細胞死受容体(FAS)、転写バリアント1、mRNA
1 ctcttctccc gcgggttggt ggacccgctc agtacggagt tggggaagct ctttcacttc
61 ggaggattgc tcaacaacca tgctgggcat ctggaccctc ctacctctgg ttcttacgtc
121 tgttgctaga ttatcgtcca aaagtgttaa tgcccaagtg actgacatca actccaaggg
181 attggaattg aggaagactg ttactacagt tgagactcag aacttggaag gcctgcatca
241 tgatggccaa ttctgccata agccctgtcc tccaggtgaa aggaaagcta gggactgcac
301 agtcaatggg gatgaaccag actgcgtgcc ctgccaagaa gggaaggagt acacagacaa
361 agcccatttt tcttccaaat gcagaagatg tagattgtgt gatgaaggac atggcttaga
421 agtggaaata aactgcaccc ggacccagaa taccaagtgc agatgtaaac caaacttttt
481 ttgtaactct actgtatgtg aacactgtga cccttgcacc aaatgtgaac atggaatcat
541 caaggaatgc acactcacca gcaacaccaa gtgcaaagag gaaggatcca gatctaactt
601 ggggtggctt tgtcttcttc ttttgccaat tccactaatt gtttgggtga agagaaagga
661 agtacagaaa acatgcagaa agcacagaaa ggaaaaccaa ggttctcatg aatctccaac
721 tttaaatcct gaaacagtgg caataaattt atctgatgtt gacttgagta aatatatcac
781 cactattgct ggagtcatga cactaagtca agttaaaggc tttgttcgaa agaatggtgt
841 caatgaagcc aaaatagatg agatcaagaa tgacaatgtc caagacacag cagaacagaa
901 agttcaactg cttcgtaatt ggcatcaact tcatggaaag aaagaagcgt atgacacatt
961 gattaaagat ctcaaaaaag ccaatctttg tactcttgca gagaaaattc agactatcat
1021 cctcaaggac attactagtg actcagaaaa ttcaaacttc agaaatgaaa tccaaagctt
1081 ggtctagagt gaaaaacaac aaattcagtt ctgagtatat gcaattagtg tttgaaaaga
1141 ttcttaatag ctggctgtaa atactgcttg gttttttact gggtacattt tatcatttat
1201 tagcgctgaa gagccaacat atttgtagat ttttaatatc tcatgattct gcctccaagg
1261 atgtttaaaa tctagttggg aaaacaaact tcatcaagag taaatgcagt ggcatgctaa
1321 gtacccaaat aggagtgtat gcagaggatg aaagattaag attatgctct ggcatctaac
1381 atatgattct gtagtatgaa tgtaatcagt gtatgttagt acaaatgtct atccacaggc
1441 taaccccact ctatgaatca atagaagaag ctatgacctt ttgctgaaat atcagttact
1501 gaacaggcag gccactttgc ctctaaatta cctctgataa ttctagagat tttaccatat
1561 ttctaaactt tgtttataac tctgagaaga tcatatttat gtaaagtata tgtatttgag
1621 tgcagaattt aaataaggct ctacctcaaa gacctttgca cagtttattg gtgtcatatt
1681 atacaatatt tcaattgtga attcacatag aaaacattaa attataatgt ttgactatta
1741 tatatgtgta tgcattttac tggctcaaaa ctacctactt ctttctcagg catcaaaagc
1801 attttgagca ggagagtatt actagagctt tgccacctct ccatttttgc cttggtgctc
1861 atcttaatgg cctaatgcac ccccaaacat ggaaatatca ccaaaaaata cttaatagtc
1921 caccaaaagg caagactgcc cttagaaatt ctagcctggt ttggagatac taactgctct
1981 cagagaaagt agctttgtga catgtcatga acccatgttt gcaatcaaag atgataaaat
2041 agattcttat ttttccccca cccccgaaaa tgttcaataa tgtcccatgt aaaacctgct
2101 acaaatggca gcttatacat agcaatggta aaatcatcat ctggatttag gaattgctct
2161 tgtcataccc ccaagtttct aagatttaag attctcctta ctactatcct acgtttaaat
2221 atctttgaaa gtttgtatta aatgtgaatt ttaagaaata atatttatat ttctgtaaat
2281 gtaaactgtg aagatagtta taaactgaag cagatacctg gaaccaccta aagaacttcc
2341 atttatggag gatttttttg ccccttgtgt ttggaattat aaaatatagg taaaagtacg
2401 taattaaata atgtttttgg tatttctggt tttctctttt ttggtagggg cttgcttttt
2461 ggttttgtct tccttttctc taactgatgc taaatataac ttgtctttaa tgcttcttgg
2521 atcccttaga aggtacttcc tttttaacct taaccctttt agtagttaaa taattatttc
2581 cataggttgc tattgccaag aagacctctt ccaaacagca catgattatt cgtcaaacag
2641 tttcgtattc cagatactgg aatgtggata agaaagtata catttcaagg ggtaggtttt
2701 attattaaga aagccaaatg aggattttga aatattcttt cctgcatatt atccattcta
2761 gctacatgct ggccagtggg ccacctttct tttctgcaat ttaatgctag taatatattc
2821 tatttaaccc atgagtccca aagtattagc atttcaacat gtaagcatgt cggtaagata
2881 gttgtgcttt gcttagggtt ccctcctgtg ttatggtctg gaaagtgtct ttaggcagaa
2941 agtctgagtg atcacagggt tcactcatta atttctcttt tctgagccat catagtctgt
3001 gctgtctgct ctccagtttt ctatttctag acagaagtag ggcaagttag gtactagtta
3061 ttcttcatgg ccagaagtgc aagttctact ttgcaagaca agattaagtt agagaacacc
3121 ctattccact ttggtgaact cagagcaaga actttgagtt cctttgggag gaagacagtg
3181 gagaagtctt tgtacttggt gatgtggttt ttttcctcat ggcttcacct agtggcccca
3241 agcatgactt ctcccatgtc aatgagcaca gccacattcc cgagttgagg tgaccccacg
3301 gtccagaatc atcctcattc tggtgaacct ggttctcttt gtggtgggca tactgggtag
3361 gagaatcacc caaaggtcac ccatgagctg cagaaaaaaa ggctatttgc agaaggagct
3421 cacagatcac attgaaagca ttgcatattc aaacatcttg gtcttcttta ttggcatgcc
3481 cacagggtct tctgacctct gattagatca gacacttttt agatattgaa tcatcagttt
3541 ctgtacaact atctgaataa ggtatataat caatgaaatt tagaattttt ttctatgctt
3601 actcctgatt ggtaatttgt ttgggtttag aattctatac aaggccattt gtaattttcc
3661 tcagcacttt aaaaatatta aaccatgttt tcttaa
「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この部分は、参照核酸分子または参照ポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含む。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000個のヌクレオチドまたはアミノ酸を含み得る。
「フラトリサイド」とは、他の免疫細胞による免疫細胞の死滅を意味し、免疫細胞の自己抗原で駆動される死滅が含まれる。特定の実施形態では、本発明の免疫細胞は、キメラ抗原受容体(CAR)を発現する免疫細胞によって認識される抗原の発現を防止または低減するように遺伝子修飾され、それによって、フラトリサイドを防止または低減する。様々な実施形態では、フラトリサイドは、インビボ(例えば、対象において)またはエクスビボ(例えば、免疫細胞調製物において)で生じ得る。
「移植片対宿主病」(GVHD)は、ドナーの移植細胞が宿主の細胞に対して免疫応答を生成する病理学的状態を指す。
「ガイドRNA」または「gRNA」とは、標的配列に特異的であり得、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)と複合体を形成し得るポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドは、ガイドRNA(gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一のRNA分子として存在し得る。単一のRNA分子として存在するgRNAは、シングルガイドRNA(sgRNA)と称され得るが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すように互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、2つのドメイン:(1)標的核酸と相同性を共有する(例えば、また、標的へのCas9複合体の結合を指示する)ドメイン、および(2)Cas9タンパク質に結合するドメインを含む。一部の実施形態では、ドメイン(2)は、tracrRNAとして知られる配列に対応し、ステム・ループ構造を含む。例えば、一部の実施形態では、ドメイン(2)は、Jinek et al.,Science 337:816-821(2012)に提供されるtracrRNAと同一または相同である(その内容全体が、参照により本明細書に援用される)。gRNAの他の例(例えば、ドメイン2を含むもの)は、「切替可能Cas9ヌクレアーゼとその使用」と題するUS2016/0208288、および「機能性ヌクレアーゼのための送達システム」と題するUS9,737,604に見出すことができる(各々の内容全体が、参照によりそれらの全体が本明細書に援用される)。一部の実施形態では、gRNAは、ドメイン(1)および(2)のうちの2つ以上を含み、「伸長gRNA」と称され得る。伸長gRNAは、本明細書に記載の2つ以上のCas9タンパク質に結合し、2つ以上の異なる領域で標的核酸に結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが、ヌクレアーゼ/RNA複合体の当該標的部位への結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。当業者に理解されるように、RNAポリヌクレオチド配列(例えば、gRNA配列)には、DNAポリヌクレオチド配列に含まれる核酸塩基チミン(T)ではなく、ピリミジン誘導体である核酸塩基ウラシル(U)が含まれる。RNAでは、ウラシルは、アデニンと塩基対を形成し、DNA転写中にチミンを置き換える。
「ヘテロ二量体」は、野生型TadAドメインとTadAドメインのバリアント(例えば、TadA*8)、または2つのバリアントTadAドメイン(例えば、TadA*7.10とTadA*8、または2つのTadA*8ドメイン)など、2つのドメインを含む融合タンパク質を意味する。
「宿主対移植片病」(HVGD)は、宿主の免疫系が、ドナーの移植細胞に対する免疫応答を生成する病理学的状態を指す。
「ハイブリダイゼーション」とは、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック水素結合、フーグスティーン水素結合、または逆フーグスティーン水素結合であり得る。例えば、アデニンおよびチミンは、水素結合の形成を通して対合する相補的な核酸塩基である。
「免疫細胞」とは、免疫応答を生成することができる免疫系の細胞を意味する。
「免疫エフェクター細胞」とは、一旦活性化されると、標的細胞に対して免疫応答をもたらし得るリンパ球を意味する。一部の実施形態では、免疫エフェクター細胞は、エフェクターT細胞である。一部の実施形態では、エフェクターT細胞は、ナイーブCD8T細胞、細胞傷害性T細胞、ナチュラルキラーT(NKT)細胞、ナチュラルキラー(NK)細胞、または制御性T(Treg)細胞である。一部の実施形態では、免疫エフェクター細胞は、エフェクターNK細胞である。一部の実施形態では、エフェクターT細胞は、胸腺細胞、未熟Tリンパ球、成熟Tリンパ球、静止Tリンパ球、または活性化Tリンパ球である。一部の実施形態では、免疫エフェクター細胞は、CD4CD8T細胞またはCD4CD8T細胞である。一部の実施形態では、免疫エフェクター細胞は、Tヘルパー細胞である。一部の実施形態では、Tヘルパー細胞は、Tヘルパー1(Th1)、Tヘルパー2(Th2)細胞、またはCD4を発現するヘルパーT細胞(CD4+T細胞)である。
「免疫応答調節遺伝子」または「免疫応答調節因子」とは、免疫応答の調節に関与するポリペプチドをコードする遺伝子を意味する。免疫応答調節遺伝子は、複数のメカニズムで、または異なるレベルで免疫応答を調節し得る。例えば、免疫応答調節遺伝子は、免疫細胞(例えば、T細胞)の活性化を抑制または促進し得る。免疫応答調節遺伝子は、免疫細胞の活性化閾値を増加または減少させ得る。一部の実施形態では、免疫応答調節遺伝子は、免疫細胞のシグナル伝達経路を正に調節する。一部の実施形態では、免疫応答調節遺伝子は、免疫細胞のシグナル伝達経路を負に調節する。一部の実施形態では、免疫応答調節遺伝子は、抗原、抗体、サイトカイン、または神経内分泌をコードする。
「免疫原性遺伝子」とは、免疫応答を誘発することができるポリペプチドをコードする遺伝子を意味する。例えば、免疫原性遺伝子は、免疫応答を誘発する免疫原をコードし得る。一部の実施形態では、免疫原性遺伝子は、細胞表面タンパク質をコードする。一部の実施形態では、免疫原性遺伝子は、細胞表面抗原または細胞表面マーカーをコードする。一部の実施形態では、細胞表面マーカーは、T細胞マーカーまたはB細胞マーカーである。一部の実施形態では、免疫原性遺伝子は、CD2、CD3e、CD3δ、CD3γ、TRAC、TRBC1、TRBC2、CD4、CD5、CD7、CD8、CD19、CD23、CD27、CD28、CD30、CD33、CD52、CD70、CD127、CD122、CD130、CD132、CD38、CD69、CD11a、CD58、CD99、CD103、CCR4、CCR5、CCR6、CCR9、CCR10、CXCR3、CXCR4、CLA、CD161、B2M、またはCIITAポリペプチドをコードする。
「塩基修復の阻害因子」または「IBR」という用語は、核酸修復酵素、例えば、塩基除去修復(BER)酵素の活性を阻害し得るタンパク質を指す。一部の実施形態では、IBRは、イノシン塩基除去修復の阻害因子である。塩基修復の例示的な阻害因子としては、APE1、EndoIII、EndoIV、EndoV、EndoVIII、Fpg、hOGG1、hNEIL1、T7 Endo1、T4 PDG、UDG、hSMUG1、およびhAAGの阻害因子が挙げられる。一部の実施形態では、IBRは、EndoVまたはhAAGの阻害因子である。一部の実施形態では、IBRは、触媒不活性EndoVまたは触媒不活性hAAGである。一部の実施形態では、塩基修復阻害因子は、EndoVまたはhAAGの阻害因子である。一部の実施形態では、塩基修復阻害因子は、触媒不活性EndoVまたは触媒不活性hAAGである。
一部の実施形態では、塩基修復阻害因子はウラシルグリコシラーゼ阻害因子(UGI)である。UGIは、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を指す。一部の実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。一部の実施形態では、本明細書に提供されるUGIタンパク質は、UGIの断片およびUGIまたはUGI断片に相同なタンパク質を含む。一部の実施形態では、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。一部の実施形態では、塩基修復阻害因子は、「触媒不活性イノシン特異的ヌクレアーゼ」または「不活性型イノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望むものではないが、触媒不活性イノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ(AAG))は、イノシンに結合することができるが、脱塩基部位を生成することも、イノシンを除去することもできず、それによって、新たに形成されたイノシン部分をDNA損傷/修復機構から立体的に遮断することができる。一部の実施形態では、触媒不活性イノシン特異的ヌクレアーゼは、核酸のイノシンに結合することができるが、核酸を切断しない。非限定的な例示的な触媒不活性イノシン特異的ヌクレアーゼとしては、例えば、ヒト由来の触媒不活性アルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および例えば、E.coli由来の触媒不活性エンドヌクレアーゼV(EndoVヌクレアーゼ)が挙げられる。一部の実施形態では、触媒不活性AAGヌクレアーゼは、E125Q変異を含むか、または別のAAGヌクレアーゼにおける対応する変異を含む。
「増加」は、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
「インテイン」は、タンパク質スプライシングとして知られているプロセスにおいて、自身を切除し、残りの断片(エクステイン)をペプチド結合で連結することができるタンパク質の断片である。インテインは、「タンパク質イントロン」とも称される。インテインが、自身を切除し、タンパク質の残りの部分を連結するプロセスは、本明細書では、「タンパク質スプライシング」または「インテイン媒介性タンパク質スプライシング」と称される。一部の実施形態では、前駆体タンパク質のインテイン(インテイン媒介性タンパク質スプライシングの前のインテイン含有タンパク質)は、2つの遺伝子に由来する。かかるインテインは、本明細書では、スプリットインテイン(例えば、スプリットインテイン-Nおよびスプリットインテイン-C)と称される。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットであるDnaEは、dnaE-nとdnaE-cの2つの別個の遺伝子によってコードされている。dnaE-n遺伝子によってコードされるインテインは、本明細書では、「インテイン-N」と称され得る。dnaE-C遺伝子によってコードされるインテインは、本明細書において「インテイン-C」と称され得る。
他のインテインシステムも使用され得る。例えば、dnaEインテイン、Cfa-N(例えば、スプリットインテイン-N)とCfa-C(例えば、スプリットインテイン-C)のインテイン対に基づく合成インテインが記載されている(例えば、Stevens et al.,J Am Chem Soc.2016 Feb.24;138(7):2162-5)。本開示に従って使用され得るインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテインが挙げられる(例えば、米国特許第8,394,604号に記載されている。参照により本明細書に援用される)。
インテインの例示的なヌクレオチドおよびアミノ酸配列を以下に提供する。
DnaEインテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaEインテイン-Nタンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
DnaEインテイン-C DNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGATATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT
インテイン-C:MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-Nタンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-Cタンパク質:MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
スプリットCas9のN末端部分およびスプリットCas9のC末端部分の連結のために、インテイン-Nおよびインテイン-Cを、それぞれ、スプリットCas9のN末端部分およびスプリットCas9のC末端部分に融合することができる。例えば、一部の実施形態では、インテイン-Nは、スプリットCas9のN末端部分のC末端に融合され、すなわち、N-[スプリットCas9のN末端部分]-[インテイン-N]-Cの構造を形成する。一部の実施形態では、インテイン-Cは、スプリットCas9のC末端部分のN末端に融合され、すなわち、N-[インテイン-C]-[スプリットCas9のC末端部分]-Cの構造を形成する。インテインが(例えば、スプリットCas9)に融合されるタンパク質を連結するためのインテイン媒介性タンパク質スプライシングのメカニズムは既知であり、例えば、Shah et al.,Chem Sci.2014;5(1):446-461に記載されている(参照により本明細書に援用される)。インテインを設計および使用するための方法は、当該技術分野において既知であり、例えば、WO2014/004336、WO2017/132580、US2015/0344549、およびUS2018/0127780に記載されている(これらの各々は、参照によりそれらの全体が本明細書に援用される)。
「単離された」、「精製された」、または「生物学的に純粋な」という用語は、天然状態で見出されるような通常それに付随する成分を、異なる程度で含まない材料を指す。「分離する」とは、元の供給源または周囲物からの分離の程度を示す。「精製する」とは、単離よりも高い分離の程度を示す。「精製された」または「生物学的に純粋な」タンパク質は、十分に他の材料を含まず、そのため、任意の不純物がタンパク質の生物学的特性に実質的に影響を与えたり、他の有害な結果を引き起こしたりしない。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって産生された場合、細胞材料、ウイルス材料、もしくは培養培地を実質的に含んでいなければ精製されており、または化学合成された場合、化学物質前駆体もしくは他の化学物質を実質的に含んでいなければ精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高性能液体クロマトグラフィーを使用して決定される。「精製された」という用語は、核酸またはタンパク質が、電気泳動ゲルにおいて本質的に1つのバンドを生じさせることを示し得る。例えば、修飾(例えば、リン酸化またはグリコシル化)を受け得るタンパク質の場合、異なる修飾は、異なる単離されたタンパク質を生じ得、別個に精製され得る。
「単離されたポリヌクレオチド」は、本発明の核酸分子が由来する生物の天然に存在するゲノムにおいて、遺伝子に隣接する遺伝子を含まない核酸(例えば、DNA)を意味する。したがって、この用語は、例えば、ベクター、自律的に複製するプラスミドもしくはウイルス、または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA、または他の配列とは独立して別個の分子(例えば、cDNA、またはPCRもしくは制限エンドヌクレアーゼ消化によって産生されたゲノムもしくはcDNA断片)として存在する組換えDNAを含む。加えて、この用語は、DNA分子から転写されるRNA分子、ならびに追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。
「単離されたポリペプチド」とは、天然に付随する成分から分離された本発明のポリペプチドを意味する。典型的には、ポリペプチドは、それが天然に会合しているタンパク質および天然に存在する有機分子を、少なくとも60重量%含まない場合、単離されている。好ましくは、調製物は、本発明のポリペプチドが、少なくとも75重量%、より好ましくは、少なくとも90重量%、最も好ましくは、少なくとも99重量%である。本発明の単離されたポリペプチドは、例えば、天然源から抽出することによって、かかるポリペプチドをコードする組換え核酸を発現させることによって、またはそのタンパク質を化学的に合成することによって、得ることができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。「リーダーペプチド」とは、新たに合成された分泌タンパク質または膜タンパク質を、膜(例えば、小胞体膜)に誘導し、通過させる短いアミノ酸配列(例えば、約16~30アミノ酸長)を意味する。リーダーペプチドは、典型的には、ポリペプチドのN末端に位置し、ポリペプチドが膜を通過した後、シグナルペプチダーゼによって除去され得る。リーダーペプチド配列は、典型的には、3つの一般的な構造的特徴:N末端極性塩基性領域(n領域)、疎水性コア、および親水性領域(c領域)を含む。一部の実施形態では、本発明のCARは、リーダーペプチド配列(例えば、抗原結合ドメインのN末端)を含む。例示的なリーダーペプチドのアミノ酸配列は、METDTLLLWVLLLWVPGSTGである。
「リンカー」という用語は、本明細書で使用される場合、2つの分子もしくは部分、例えば、タンパク質複合体もしくはリボ核複合体の2つの成分、または融合タンパク質の2つのドメイン(例えば、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えば、dCas9)とデアミナーゼドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ))を連結する、結合(例えば、共有結合)、化学基、または分子を指す。リンカーは、塩基エディターシステムの異なる成分、または成分の異なる部分を連結することができる。例えば、一部の実施形態では、リンカーは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインとデアミナーゼの触媒ドメインを連結することができる。一部の実施形態では、リンカーは、CRISPRポリペプチドとデアミナーゼを連結することができる。一部の実施形態では、リンカーは、Cas9とデアミナーゼを連結することができる。一部の実施形態では、リンカーは、dCas9とデアミナーゼを連結することができる。一部の実施形態では、リンカーは、nCas9とデアミナーゼを連結することができる。一部の実施形態では、リンカーは、ガイドポリヌクレオチドとデアミナーゼを連結することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分とポリヌクレオチドプログラマブルヌクレオチド結合成分を連結することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラマブルヌクレオチド結合成分を結合することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラマブルヌクレオチド結合成分のRNA結合部分を連結することができる。リンカーは、2つの基、分子、もしくは他の部分の間に位置するか、またはそれに隣接し、共有結合性もしくは非共有結合性の相互作用を介して各々に連結され得、したがって、両者を連結する。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分であり得る。一部の実施形態では、リンカーは、ポリヌクレオチドであり得る。一部の実施形態では、リンカーは、DNAリンカーであり得る。一部の実施形態では、リンカーは、RNAリンカーであり得る。一部の実施形態では、リンカーは、リガンドに結合することができるアプタマーを含み得る。一部の実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。一部の実施形態では、リンカーは、リボスイッチに由来し得るアプタマーを含み得る。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸(TPP)リボスイッチ、アデノシンコバラミン(AdoCbl)リボスイッチ、S-アデノシルメチオニン(SAM)リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド(FMN)リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレキューオシン1(PreQ1)リボスイッチから選択され得る。一部の実施形態では、リンカーは、ポリペプチドまたはタンパク質ドメインに結合したアプタマー(例えば、ポリペプチドリガンド)を含んでもよい。一部の実施形態では、ポリペプチドリガンドは、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。一部の実施形態では、ポリペプチドリガンドは、塩基エディターシステム成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。
一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)であり得る。一部の実施形態では、リンカーは、約5~100アミノ酸長、例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、または90~100アミノ酸長であり得る。一部の実施形態では、リンカーは、約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸長であり得る。また、より長いまたはより短いリンカーも企図され得る。
一部の実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログラマブルヌクレアーゼのgRNA結合ドメインと核酸編集タンパク質(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)の触媒ドメインを連結する。一部の実施形態では、リンカーは、dCas9と核酸編集タンパク質を連結する。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介して各々に連結され、したがって、両者を連結する。一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、5~200アミノ酸長、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸長である。また、より長いまたはより短いリンカーも企図される。一部の実施形態では、リンカーは、アミノ酸配列SGSETPGTSESATPESを含み、XTENリンカーとも称され得る。一部の実施形態では、リンカーは、アミノ酸配列SGGSを含む。一部の実施形態では、リンカーは、(SGGS)、(GGGS)、(GGGGS)、(G)n、(EAAAK)、(GGS)、SGSETPGTSESATPES、または(XP)モチーフ、またはこれらのうちのいずれかの組み合わせを含み、nは、独立して、1~30の整数であり、Xは、任意のアミノ酸である。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、複数のプロリン残基を含み、5~21、5~14、5~9、5~7アミノ酸長、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)、P(AP)、P(AP)10である。このようなプロリンに富むリンカーは、「剛性」リンカーとも称される。
一部の実施形態では、キメラ抗原受容体は、少なくとも1つのリンカーを含む。少なくとも1つのリンカーは、キメラ抗原受容体の細胞外結合ドメインの重鎖可変(VH)領域を、重鎖定常(CH)領域に連結または結合する。リンカーはまた、細胞外結合ドメインの軽鎖可変(VL)領域を、可変定常(VC)領域に連結することもできる。
一部の実施形態では、塩基エディターのドメインは、以下のアミノ酸配列を含むリンカーを介して融合される:
SGGSSGSETPGTSESATPESSGGS、
SGGSSGGSSGSETPGTSESATPESSGGSSGGS、または
GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS。
一部の実施形態では、塩基エディターのドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合され、これはXTENリンカーとも称され得る。一部の実施形態では、リンカーは、アミノ酸配列SGGSを含む。一部の実施形態では、リンカーは、24アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。一部の実施形態では、リンカーは、40アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。一部の実施形態では、リンカーは、64アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。一部の実施形態では、リンカーは、92アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
本明細書で使用される「液体がん」という用語は、例えば、血液、リンパ、および骨髄などの体液中に存在するがん細胞を指す。液体がんには、白血病、骨髄腫、および液体リンパ腫が含まれるが、これらに限定されない。本明細書で使用される液体がんには、肉腫およびがん腫などの固形腫瘍、または固形リンパ腫(嚢胞もしくは液体領域を含まない)は含まれない。「液体がん」は、再発性、難治性、または転移性であり得る。本明細書に記載の方法で治療される液体がんは、例えば、液体リンパ腫であり得る。液体リンパ腫には、嚢胞または液体領域を含むリンパ腫が含まれる。
「リンパ球活性化遺伝子3(LAG-3)ポリペプチド」とは、NCBI受託番号NP_002277.4またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_002277.4 リンパ球活性化遺伝子3タンパク質前駆体[Homo sapiens]
1 MWEAQFLGLL FLQPLWVAPV KPLQPGAEVP VVWAQEGAPA QLPCSPTIPL QDLSLLRRAG
61 VTWQHQPDSG PPAAAPGHPL APGPHPAAPS SWGPRPRRYT VLSVGPGGLR SGRLPLQPRV
121 QLDERGRQRG DFSLWLRPAR RADAGEYRAA VHLRDRALSC RLRLRLGQAS MTASPPGSLR
181 ASDWVILNCS FSRPDRPASV HWFRNRGQGR VPVRESPHHH LAESFLFLPQ VSPMDSGPWG
241 CILTYRDGFN VSIMYNLTVL GLEPPTPLTV YAGAGSRVGL PCRLPAGVGT RSFLTAKWTP
301 PGGGPDLLVT GDNGDFTLRL EDVSQAQAGT YTCHIHLQEQ QLNATVTLAI ITVTPKSFGS
361 PGSLGKLLCE VTPVSGQERF VWSSLDTPSQ RSFSGPWLEA QEAQLLSQPW QCQLYQGERL
421 LGAAVYFTEL SSPGAQRSGR APGALPAGHL LLFLILGVLS LLLLVTGAFG FHLWRRQWRP
481 RRFSALEQGI HPPQAQSKIE ELEQEPEPEP EPEPEPEPEP EPEQL
「リンパ球活性化遺伝子3(LAG-3)ポリヌクレオチド」とは、LAG-3ポリペプチドをコードする核酸を意味する。例示的なLAG-3核酸配列を以下に提供する。
>NM_002286.6 Homo sapiensリンパ球活性化3(LAG3)、mRNA
1 agagaccagc agaacggcat cccagccacg acggccactt tgctctgtct gctctccgcc
61 acggccctgc tctgttccct gggacacccc cgcccccacc tcctcaggct gcctgatctg
121 cccagctttc cagctttcct ctggattccg gcctctggtc atccctcccc accctctctc
181 caaggccctc tcctggtctc ccttcttcta gaaccccttc ctccacctcc ctctctgcag
241 aacttctcct ttacccccca ccccccacca ctgccccctt tccttttctg acctcctttt
301 ggagggctca gcgctgccca gaccatagga gagatgtggg aggctcagtt cctgggcttg
361 ctgtttctgc agccgctttg ggtggctcca gtgaagcctc tccagccagg ggctgaggtc
421 ccggtggtgt gggcccagga gggggctcct gcccagctcc cctgcagccc cacaatcccc
481 ctccaggatc tcagccttct gcgaagagca ggggtcactt ggcagcatca gccagacagt
541 ggcccgcccg ctgccgcccc cggccatccc ctggcccccg gccctcaccc ggcggcgccc
601 tcctcctggg ggcccaggcc ccgccgctac acggtgctga gcgtgggtcc cggaggcctg
661 cgcagcggga ggctgcccct gcagccccgc gtccagctgg atgagcgcgg ccggcagcgc
721 ggggacttct cgctatggct gcgcccagcc cggcgcgcgg acgccggcga gtaccgcgcc
781 gcggtgcacc tcagggaccg cgccctctcc tgccgcctcc gtctgcgcct gggccaggcc
841 tcgatgactg ccagcccccc aggatctctc agagcctccg actgggtcat tttgaactgc
901 tccttcagcc gccctgaccg cccagcctct gtgcattggt tccggaaccg gggccagggc
961 cgagtccctg tccgggagtc cccccatcac cacttagcgg aaagcttcct cttcctgccc
1021 caagtcagcc ccatggactc tgggccctgg ggctgcatcc tcacctacag agatggcttc
1081 aacgtctcca tcatgtataa cctcactgtt ctgggtctgg agcccccaac tcccttgaca
1141 gtgtacgctg gagcaggttc cagggtgggg ctgccctgcc gcctgcctgc tggtgtgggg
1201 acccggtctt tcctcactgc caagtggact cctcctgggg gaggccctga cctcctggtg
1261 actggagaca atggcgactt tacccttcga ctagaggatg tgagccaggc ccaggctggg
1321 acctacacct gccatatcca tctgcaggaa cagcagctca atgccactgt cacattggca
1381 atcatcacag tgactcccaa atcctttggg tcacctggat ccctggggaa gctgctttgt
1441 gaggtgactc cagtatctgg acaagaacgc tttgtgtgga gctctctgga caccccatcc
1501 cagaggagtt tctcaggacc ttggctggag gcacaggagg cccagctcct ttcccagcct
1561 tggcaatgcc agctgtacca gggggagagg cttcttggag cagcagtgta cttcacagag
1621 ctgtctagcc caggtgccca acgctctggg agagccccag gtgccctccc agcaggccac
1681 ctcctgctgt ttctcatcct tggtgtcctt tctctgctcc ttttggtgac tggagccttt
1741 ggctttcacc tttggagaag acagtggcga ccaagacgat tttctgcctt agagcaaggg
1801 attcaccctc cgcaggctca gagcaagata gaggagctgg agcaagaacc ggagccggag
1861 ccggagccgg aaccggagcc cgagcccgag cccgagccgg agcagctctg acctggagct
1921 gaggcagcca gcagatctca gcagcccagt ccaaataaac tccctgtcag cagcaa
「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任意のタンパク質またはポリヌクレオチドを意味する。
「変異」という用語は、本明細書で使用される場合、配列(例えば、核酸配列もしくはアミノ酸配列)内の残基の別の残基による置換、または配列内の1つ以上の残基の欠失もしくは挿入を指す。変異は、典型的には、元の残基、続いて、配列内の残基の位置、および新たに置換された残基の同一性を特定することによって、本明細書に記載される。本明細書に提供されるアミノ酸置換(変異)を作製するための様々な方法は、当該技術分野で周知であり、例えば、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))に提供されている。一部の実施形態では、本開示の塩基エディターは、相当数の意図されていない変異(例えば、意図されていない点変異)を生成することなく、核酸(例えば、対象のゲノム内の核酸)の点変異などの「意図された変異」を効率的に生成することができる。一部の実施形態では、意図された変異は、意図された変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基エディター(例えば、シチジン塩基エディターまたはアデノシン塩基エディター)によって生成される変異である。
一般に、配列(例えば、本明細書に記載されるアミノ酸配列)において作製または特定される変異は、参照(または野生型)配列、すなわち、変異を含まない配列に関連して番号付けされる。当業者は、参照配列に対して、アミノ酸配列および核酸配列における変異の位置を決定する方法を容易に理解するであろう。
「腫瘍」は、異常な成長もしくは増殖を示す細胞または組織を指す。腫瘍という用語は、がん、液状腫瘍、および固形腫瘍を包含する。一部の実施形態では、腫瘍は、固形腫瘍である。他の実施形態では、腫瘍は、液体腫瘍である。一部の実施形態では、腫瘍は、血液がんである。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。一部の実施形態では、血液がんは、B細胞がんである。一部の実施形態では、B細胞がんは、リンパ腫または白血病である。場合によっては、白血病は、前白血病を含む。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。
腫瘍の非限定的な例としては、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫が挙げられる。一部の実施形態では、腫瘍は、T細胞急性リンパ芽球性白血病(T-ALL)である。一部の実施形態では、腫瘍は、急性骨髄性白血病(AML)である。
「活性化T細胞核内因子1(NFATc1)ポリペプチド」とは、NCBI受託番号NM_172390.2またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、活性化T細胞DNA結合転写複合体の成分であるタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>NP_765978.1活性化T細胞核内因子、細胞質1アイソフォームA[Homo sapiens]
MPSTSFPVPSKFPLGPAAAVFGRGETLGPAPRAGGTMKSAEEEHYGYASSNVSPALPLPTAHSTLPAPCHNLQTSTPGIIPPADHPSGYGAALDGGPAGYFLSSGHTRPDGAPALESPRIEITSCLGLYHNNNQFFHDVEVEDVLPSSKRSPSTATLSLPSLEAYRDPSCLSPASSLSSRSCNSEASSYESNYSYPYASPQTSPWQSPCVSPKTTDPEEGFPRGLGACTLLGSPRHSPSTSPRASVTEESWLGARSSRPASPCNKRKYSLNGRQPPYSPHHSPTPSPHGSPRVSVTDDSWLGNTTQYTSSAIVAAINALTTDSSLDLGDGVPVKSRKTTLEQPPSVALKVEPVGEDLGSPPPPADFAPEDYSSFQHIRKGGFCDQYLAVPQHPYQWAKPKPLSPTSYMSPTLPALDWQLPSHSGPYELRIEVQPKSHHRAHYETEGSRGAVKASAGGHPIVQLHGYLENEPLMLQLFIGTADDRLLRPHAFYQVHRITGKTVSTTSHEAILSNTKVLEIPLLPENSMRAVIDCAGILKLRNSDIELRKGETDIGRKNTRVRLVFRVHVPQPSGRTLSLQVASNPIECSQRSAQELPLVEKQSTDSYPVVGGKKMVLSGHNFLQDSKVIFVEKAPDGHHVWEMEAKTDRDLCKPNSLVVEIPPFRNQRITSPVHVSFYVCNGKRKRSQYQRFTYLPANGNAIFLTVSREHERVGCFF
「活性化T細胞核内因子1(NFATc1)ポリヌクレオチド」とは、NFATc1ポリペプチドをコードする核酸分子を意味する。NFATc1遺伝子は、T細胞においてサイトカイン遺伝子(特に、IL-2およびIL-4)の誘導性発現に関与するタンパク質をコードする。配列決定された例示的な核酸を以下に提供する。
>NM_172390.2 Homo sapiens活性化T細胞核内因子1(NFATC1)、転写バリアント1、mRNA
GGCGGGCGCTCGGCGACTCGTCCCCGGGGCCCCGCGCGGGCCCGGGCAGCAGGGGCGTGATGTCACGGCAGGGAGGGGGCGCGGGAGCCGCCGGGCCGGCGGGGAGGCGGGGGAGGTGTTTTCCAGCTTTAAAAAGGCAGGAGGCAGAGCGCGGCCCTGCGTCAGAGCGAGACTCAGAGGCTCCGAACTCGCCGGCGGAGTCGCCGCGCCAGATCCCAGCAGCAGGGCGCGGGCACCGGGGCGCGGGCAGGGCTCGGAGCCACCGCGCAGGTCCTAGGGCCGCGGCCGGGCCCCGCCACGCGCGCACACGCCCCTCGATGACTTTCCTCCGGGGCGCGCGGCGCTGAGCCCGGGGCGAGGGCTGTCTTCCCGGAGACCCGACCCCGGCAGCGCGGGGCGGCCGCTTCTCCTGTGCCTCCGCCCGCCGCTCCACTCCCCGCCGCCGCCGCGCGGATGCCAAGCACCAGCTTTCCAGTCCCTTCCAAGTTTCCACTTGGCCCTGCGGCTGCGGTCTTCGGGAGAGGAGAAACTTTGGGGCCCGCGCCGCGCGCCGGCGGCACCATGAAGTCAGCGGAGGAAGAACACTATGGCTATGCATCCTCCAACGTCAGCCCCGCCCTGCCGCTCCCCACGGCGCACTCCACCCTGCCGGCCCCGTGCCACAACCTTCAGACCTCCACACCGGGCATCATCCCGCCGGCGGATCACCCCTCGGGGTACGGAGCAGCTTTGGACGGTGGGCCCGCGGGCTACTTCCTCTCCTCCGGCCACACCAGGCCTGATGGGGCCCCTGCCCTGGAGAGTCCTCGCATCGAGATAACCTCGTGCTTGGGCCTGTACCACAACAATAACCAGTTTTTCCACGATGTGGAGGTGGAAGACGTCCTCCCTAGCTCCAAACGGTCCCCCTCCACGGCCACGCTGAGTCTGCCCAGCCTGGAGGCCTACAGAGACCCCTCGTGCCTGAGCCCGGCCAGCAGCCTGTCCTCCCGGAGCTGCAACTCAGAGGCCTCCTCCTACGAGTCCAACTACTCGTACCCGTACGCGTCCCCCCAGACGTCGCCATGGCAGTCTCCCTGCGTGTCTCCCAAGACCACGGACCCCGAGGAGGGCTTTCCCCGCGGGCTGGGGGCCTGCACACTGCTGGGTTCCCCGCGGCACTCCCCCTCCACCTCGCCCCGCGCCAGCGTCACTGAGGAGAGCTGGCTGGGTGCCCGCTCCTCCAGACCCGCGTCCCCTTGCAACAAGAGGAAGTACAGCCTCAACGGCCGGCAGCCGCCCTACTCACCCCACCACTCGCCCACGCCGTCCCCGCACGGCTCCCCGCGGGTCAGCGTGACCGACGACTCGTGGTTGGGCAACACCACCCAGTACACCAGCTCGGCCATCGTGGCCGCCATCAACGCGCTGACCACCGACAGCAGCCTGGACCTGGGAGATGGCGTCCCTGTCAAGTCCCGCAAGACCACCCTGGAGCAGCCGCCCTCAGTGGCGCTCAAGGTGGAGCCCGTCGGGGAGGACCTGGGCAGCCCCCCGCCCCCGGCCGACTTCGCGCCCGAAGACTACTCCTCTTTCCAGCACATCAGGAAGGGCGGCTTCTGCGACCAGTACCTGGCGGTGCCGCAGCACCCCTACCAGTGGGCGAAGCCCAAGCCCCTGTCCCCTACGTCCTACATGAGCCCGACCCTGCCCGCCCTGGACTGGCAGCTGCCGTCCCACTCAGGCCCGTATGAGCTTCGGATTGAGGTGCAGCCCAAGTCCCACCACCGAGCCCACTACGAGACGGAGGGCAGCCGGGGGGCCGTGAAGGCGTCGGCCGGAGGACACCCCATCGTGCAGCTGCATGGCTACTTGGAGAATGAGCCGCTGATGCTGCAGCTTTTCATTGGGACGGCGGACGACCGCCTGCTGCGCCCGCACGCCTTCTACCAGGTGCACCGCATCACAGGGAAGACCGTGTCCACCACCAGCCACGAGGCCATCCTCTCCAACACCAAAGTCCTGGAGATCCCACTCCTGCCGGAGAACAGCATGCGAGCCGTCATTGACTGTGCCGGAATCCTGAAACTCAGAAACTCCGACATTGAACTTCGGAAAGGAGAGACGGACATCGGGAGGAAGAACACACGGGTACGGCTGGTGTTCCGCGTTCACGTCCCGCAACCCAGCGGCCGCACGCTGTCCCTGCAGGTGGCCTCCAACCCCATCGAATGCTCCCAGCGCTCAGCTCAGGAGCTGCCTCTGGTGGAGAAGCAGAGCACGGACAGCTATCCGGTCGTGGGCGGGAAGAAGATGGTCCTGTCTGGCCACAACTTCCTGCAGGACTCCAAGGTCATTTTCGTGGAGAAAGCCCCAGATGGCCACCATGTCTGGGAGATGGAAGCGAAAACTGACCGGGACCTGTGCAAGCCGAATTCTCTGGTGGTTGAGATCCCGCCATTTCGGAATCAGAGGATAACCAGCCCCGTTCACGTCAGTTTCTACGTCTGCAACGGGAAGAGAAAGCGAAGCCAGTACCAGCGTTTCACCTACCTTCCCGCCAACGGTAACGCCATCTTTCTAACCGTAAGCCGTGAACATGAGCGCGTGGGGTGCTTTTTCTAAAGACGCAGAAACGACGTCGCCGTAAAGCAGCGTGGCGTGTTGCACATTTAACTGTGTGATGTCCCGTTAGTGAGACCGAGCCATCGATGCCCTGAAAAGGAAAGGAAAAGGGAAGCTTCGGATGCATTTTCCTTGATCCCTGTTGGGGGTGGGGGGCGGGGGTTGCATACTCAGATAGTCACGGTTATTTTGCTTCTTGCGAATGTATAACAGCCAAGGGGAAAACATGGCTCTTCTGCTCCAAAAAACTGAGGGGGTCCTGGTGTGCATTTGCACCCTAAAGCTGCTTACGGTGAAAAGGCAAATAGGTATAGCTATTTTGCAGGCACCTTTAGGAATAAACTTTGCTTTTAAGCCTGTAAAAAAAAAAAAAA
「非保存的変異」という用語は、異なるグループ間のアミノ酸置換(例えば、トリプトファンに対してリジン、またはセリンに対してフェニルアラニンなど)を含む。この場合、非保存的アミノ酸置換は、機能的バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が、野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増強することができる。
「核局在化配列」、「核局在化シグナル」、または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を指す。核局在化配列は、当該技術分野で既知であり、例えば、Plankらの2000年11月23日に出願された国際PCT出願PCT/EP2000/011690(WO/2001/038547として2001年5月31日に公開)に記載されている(それらの内容は、例示的な核局在化配列のそれらの開示のために、参照により本明細書に援用される)。他の実施形態では、NLSは、例えば、Koblan et al.,Nature Biotech.2018 doi:10.1038/nbt.4172に記載されている最適化NLSである。一部の実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
本明細書で使用される「核酸」および「核酸分子」という用語は、核酸塩基および酸性部分(例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマー)を含む化合物を指す。典型的には、ポリマー核酸(例えば、3つ以上のヌクレオチドを含む核酸分子)は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖分子である。一部の実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指す。一部の実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用される場合、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語は、ヌクレオチドのポリマー(例えば、少なくとも3つのヌクレオチドの鎖)を指すように、互換的に使用され得る。一部の実施形態では、「核酸」は、RNA、ならびに一本鎖および/または二本鎖のDNAを包含する。核酸は、天然に存在する核酸分子(例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体の文脈で)、または他の天然に存在する核酸分子であり得る。他方、核酸分子は、天然に存在しない分子(例えば、組換えDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド)であり得、または非天然のヌクレオチドもしくはヌクレオシドを含んでもよい。さらに、「核酸」、「DNA」、「RNA」という用語、および/または類似の用語には、核酸類似体(例えば、ホスホジエステル骨格以外を有する類似体)が含まれる。核酸は、天然源から精製され、組換え発現システムを使用して産生され、任意選択的に、精製され、化学的に合成されるなどされ得る。該当する場合、例えば、化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖、および骨格修飾を有する類似体などのヌクレオシド類似体を含み得る。核酸配列は、別段の記載がない限り、5’から3’方向に提示される。一部の実施形態では、核酸は、天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)、ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニルウリジン、C5-プロピニルシチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン)、化学修飾塩基、生物修飾塩基(例えば、メチル化塩基)、挿入塩基、修飾糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース)、ならびに/または修飾リン酸基(例えば、ホスホロチオエートおよび5’-N-ホスホロアミダイト架橋)であるか、またはそれらを含む。「核酸プログラマブルDNA結合タンパク質」または「napDNAbp」という用語は、「ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン」と互換的に使用され得、napDNAbpを特定の核酸配列に誘導するガイド核酸またはガイドポリヌクレオチド(例えば、gRNA)などの核酸(例えば、DNAまたはRNA)と会合するタンパク質を指し得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、Cas9タンパク質を、ガイドRNAに相補的である特異的DNA配列に誘導するガイドRNAと会合することができる。一部の実施形態では、napDNAbpは、Cas9ドメイン、例えば、ヌクレアーゼ活性型Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性型Cas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の非限定的な例としては、Cas9(例えば、dCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られている)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの修飾もしくは操作されたバージョンが挙げられる。他の核酸プログラマブルDNA結合タンパク質もまた、本開示の範囲内であるが、それらは本開示に具体的に列挙されていない場合がある。例えば、Makarova et al.“Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?”CRISPR J.2018 Oct;1:325-336.doi:10.1089/crispr.2018.0033、Yan et al.,“Functionally diverse type V CRISPR-Cas systems”Science.2019 Jan 4;363(6422):88-91.doi:10.1126/science.aav7271を参照されたい(各々の内容全体が、参照により本明細書に援用される)。
「核酸塩基」、「窒素塩基」、または「塩基」という用語は、本明細書で互換的に使用され、ヌクレオチドの成分であるヌクレオシドを形成する窒素含有生物学的化合物を指す。核酸塩基が塩基対を形成し、互いに積み重なる能力は、リボ核酸(RNA)およびデオキシリボ核酸(DNA)などの長鎖ヘリックス構造に直接つながる。アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、およびウラシル(U)の5つの核酸塩基は、一次または正準と呼ばれる。アデニンおよびグアニンは、プリンに由来し、シトシン、ウラシル、およびチミンは、ピリミジンに由来する。DNAおよびRNAはまた、修飾された他の(非一次)塩基を含むことができる。非限定的な例示的な修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、および5-ヒドロメチルシトシン(hydromethylcytosine)が挙げられる。ヒポキサンチンとキサンチンは、両方とも、変異誘発物質の存在により、脱アミノ化(アミン基をカルボニル基で置換すること)を介して生成され得る。ヒポキサンチンは、アデニンから修飾され得る。キサンチンは、グアニンから修飾され得る。ウラシルは、シトシンの脱アミノから生じ得る。「ヌクレオシド」は、核酸塩基および五炭糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例として、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドの例としては、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、およびシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)、および少なくとも1つのリン酸基からなる。
「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書で使用される場合、シトシン(もしくはシチジン)のウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への脱アミノ化、およびアデニン(もしくはアデノシン)のヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加および挿入などの、RNAもしくはDNAにおける核酸塩基修飾を触媒することができるタンパク質または酵素を指す。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼ;またはシチジンデアミナーゼまたはシトシンデアミナーゼ)である。一部の実施形態では、核酸塩基編集ドメインは、2つ以上のデアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼとシチジンデアミナーゼまたはシトシンデアミナーゼ)である。一部の実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。一部の実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメイン由来の操作されたもしくは進化した核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。
本明細書で使用される場合、「薬剤を取得すること」における「取得すること」は、薬剤を合成すること、購入すること、またはその他の取得することを含む。本明細書で使用される「患者」または「対象」とは、疾患または障害と診断されているか、それを有するリスクもしくは発症するリスクがあるか、またはそれを有する疑いもしくは発症する疑いがある、哺乳動物の対象または個体を指す。一部の実施形態では、「患者」という用語は、疾患または障害を発症する可能性が平均よりも高い哺乳動物対象を指す。例示的な患者は、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、げっ歯類(例えば、マウス、ウサギ、ラット、またはモルモット)および本明細書に開示される療法から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。
「それを必要とする患者」または「それを必要とする対象」は、本明細書では、疾患または障害(例えば、T細胞性またはNK細胞性の悪性腫瘍)を有すると診断されているか、それを有するリスクがあるか、それを有すると既定されているか、またはそれを有すると疑われる患者を指す。
「病原性変異」、「病原性バリアント」、「疾患ケーシング(disease casing)変異」、「病因性バリアント」、「有害な変異」、または「素因のある変異」という用語は、特定の疾患または障害に対する個体の感受性もしくは素因を増加させる遺伝子の変化または変異を指す。一部の実施形態では、病原性変異は、遺伝子によってコードされるタンパク質において、少なくとも1つの病原性アミノ酸によって置換された少なくとも1つの野生型アミノ酸を含む。
「薬学的に許容される担体」という用語は、化合物を体のある部位(例えば、送達部位)から別の部位(例えば、臓器、組織、または体の一部)に運搬もしくは輸送することに関与する、液体もしくは固体充填剤、希釈剤、賦形剤、製造助剤(例えば、潤滑剤、タルク、マグネシウム、ステアリン酸カルシウムもしくは亜鉛、または立体酸(steric acid))、または溶媒封入材などの、薬学的に許容される材料、組成物、またはビヒクルを意味する。薬学的に許容される担体は、製剤の他の成分と適合性であるという意味で「許容される」ものであり、対象の組織に害を及ぼさない(例えば、生理学的に適合する、無菌、生理学的pHなど)。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書において互換的に使用される。
「薬学的組成物」という用語は、薬学的使用のために製剤化される組成物を意味する。一部の実施形態では、薬学的組成物は、薬学的に許容される担体をさらに含む。一部の実施形態では、薬学的組成物は、追加の薬剤(例えば、特異的送達用、半減期の増加、または他の治療用化合物)を含む。
「プログラム細胞死1(PDCD1またはPD-1)ポリペプチド」とは、NCBI受託番号AJS10360.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有するタンパク質を意味する。PD-1タンパク質は、免疫反応中および許容条件下でT細胞の機能調節に関与していると考えられている。例示的なB2Mポリペプチド配列を以下に提供する。
>AJS10360.1 プログラム細胞死1タンパク質[Homo sapiens]
MQIPQAPWPVVWAVLQLGWRPGWFLDSPDRPWNPPTFSPALLVVTEGDNATFTCSFSNTSESFVLNWYRMSPSNQTDKLAAFPEDRSQPGQDCRFRVTQLPNGRDFHMSVVRARRNDSGTYLCGAISLAPKAQIKESLRAELRVTERRAEVPTAHPSPSPRPAGQFQTLVVGVVGGLLGSLVLLVWVLAVICSRAARGTIGARRTGQPLKEDPSAVPVFSVDYGELDFQWREKTPEPPVPCVPEQTEYATIVFPSGMGTSSPARRGSADGPRSAQPLRPEDGHCSWPL
「プログラム細胞死1(PDCD1またはPD-1)ポリヌクレオチド」とは、PD-1ポリペプチドをコードする核酸分子を意味する。PDCD1遺伝子は、抑制性の細胞表面受容体をコードし、抗原特異的な様式で、T細胞のエフェクター機能を阻害する。例示的なPDCD1核酸配列を以下に提供する。
>AY238517.1 Homo sapiensプログラム細胞死1(PDCD1)mRNA、完全長CDS
ATGCAGATCCCACAGGCGCCCTGGCCAGTCGTCTGGGCGGTGCTACAACTGGGCTGGCGGCCAGGATGGTTCTTAGACTCCCCAGACAGGCCCTGGAACCCCCCCACCTTCTCCCCAGCCCTGCTCGTGGTGACCGAAGGGGACAACGCCACCTTCACCTGCAGCTTCTCCAACACATCGGAGAGCTTCGTGCTAAACTGGTACCGCATGAGCCCCAGCAACCAGACGGACAAGCTGGCCGCCTTCCCCGAGGACCGCAGCCAGCCCGGCCAGGACTGCCGCTTCCGTGTCACACAACTGCCCAACGGGCGTGACTTCCACATGAGCGTGGTCAGGGCCCGGCGCAATGACAGCGGCACCTACCTCTGTGGGGCCATCTCCCTGGCCCCCAAGGCGCAGATCAAAGAGAGCCTGCGGGCAGAGCTCAGGGTGACAGAGAGAAGGGCAGAAGTGCCCACAGCCCACCCCAGCCCCTCACCCAGGCCAGCCGGCCAGTTCCAAACCCTGGTGGTTGGTGTCGTGGGCGGCCTGCTGGGCAGCCTGGTGCTGCTAGTCTGGGTCCTGGCCGTCATCTGCTCCCGGGCCGCACGAGGGACAATAGGAGCCAGGCGCACCGGCCAGCCCCTGAAGGAGGACCCCTCAGCCGTGCCTGTGTTCTCTGTGGACTATGGGGAGCTGGATTTCCAGTGGCGAGAGAAGACCCCGGAGCCCCCCGTGCCCTGTGTCCCTGAGCAGACGGAGTATGCCACCATTGTCTTTCCTAGCGGAATGGGCACCTCATCCCCCGCCCGCAGGGGCTCAGCTGACGGCCCTCGGAGTGCCCAGCCACTGAGGCCTGAGGATGGACACTGCTCTTGGCCCCTCTGA
「タンパク質」、「ペプチド」、「ポリペプチド」という用語、およびそれらの文法的等価物は、本明細書において互換的に使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の集合体を指し得る。タンパク質、ペプチド、またはポリペプチド中のアミノ酸のうちの1つ以上は、例えば、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカー(共役、官能化、または他の修飾用)などの化学物質の添加によって修飾することができる。また、タンパク質、ペプチド、またはポリペプチドは、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在する、組換え、もしくは合成のもの、またはそれらの任意の組み合わせであり得る。本明細書で使用される「融合タンパク質」という用語は、ハイブリッドポリペプチドを指し、少なくとも2つの異なるタンパク質からのタンパク質ドメインを含む。1つのタンパク質は、融合タンパク質のアミノ末端(N末端)部分、またはタンパク質のカルボキシ末端(C末端)に位置することができ、したがって、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質をそれぞれ形成する。タンパク質は、異なるドメイン例えば、核酸結合ドメイン(例えば、タンパク質の標的部位への結合を誘導するCas9のgRNA結合ドメイン)および核酸切断ドメイン、または核酸編集タンパク質の触媒ドメインを含み得る。一部の実施形態では、タンパク質は、タンパク質性部分(例えば、核酸結合ドメイン)を構成するアミノ酸配列、および有機化合物(例えば、核酸切断剤)として機能し得る化合物を含む。一部の実施形態では、タンパク質は、核酸(例えば、RNAまたはDNA)と複合体を形成しているか、または核酸(例えば、RNAまたはDNA)と会合している。本明細書に提供されるタンパク質のいずれかは、当該技術分野で既知の任意の方法によって産生され得る。例えば、本明細書に提供されるタンパク質は、組換えタンパク質の発現および精製を介して産生され得、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))に記載されているものが含まれる(その内容全体が、参照により本明細書に援用される)。
本明細書に開示されるポリペプチドおよびタンパク質(その機能部分および機能性バリアントを含む)は、1つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含み得る。かかる合成アミノ酸は、当該技術分野で既知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノ-n-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、トランス-3-およびトランス-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリン、β-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸モノアミド、N’-ベンジル-N’-メチル-リジン、N’N’-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α、γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、ならびにα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾物と会合し得る。翻訳後修飾の非限定的な例としては、リン酸化、アシル化(アセチル化およびホルミル化を含む)、グリコシル化(N結合およびO結合を含む)、アミド化、ヒドロキシル化、アルキル化(メチル化およびエチル化を含む)、ユビキチン化、ピロリドンカルボン酸の付加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化、およびヨウ素化が挙げられる。
「プロモーター」とは、核酸の転写を指示する核酸制御配列のアレイを意味する。プロモーターは、転写の開始部位の近くの必要な核酸配列を含む。プロモーターはまた、任意選択的に、遠位のエンハンサーまたはリプレッサー配列要素を含む。「構成的プロモーター」は、持続的に活性であり、外部のシグナルまたは分子による調節を受けないプロモーターである。対照的に、「誘導性プロモーター」の活性は、外部のシグナルまたは分子(例えば、転写因子)によって調節される。例として、プロモーターは、CMVプロモーターであり得る。
タンパク質または核酸の文脈で本明細書で使用される「組換え」という用語は、天然には存在せず、人工の産物であるタンパク質または核酸を指す。例えば、一部の実施形態では、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸配列またはヌクレオチド配列を含む。
「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
「参照」とは、標準条件または対照条件を意味する。一実施形態では、参照は、野生型または健康な細胞である。他の実施形態では、参照は、未処理細胞であり、試験条件に供されないか、あるいはプラセボもしくは生理食塩水、培地、緩衝液、および/または目的のポリヌクレオチドを保有しない対照ベクターに供される。
「参照配列」は、配列比較の基礎として使用される定義された配列である。参照配列は、特定の配列のサブセットまたはその全体、例えば、全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAもしくは遺伝子配列であり得る。ポリペプチドの場合、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸の場合、参照核酸配列の長さは、概して、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、および約100ヌクレオチドもしくは約300ヌクレオチド、またはその辺りのもしくはその間の任意の整数である。一部の実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
「RNAプログラマブルヌクレアーゼ」および「RNAガイドヌクレアーゼ」という用語は、切断の標的ではない1つ以上のRNAとともに(例えば、それと結合または会合して)使用される。一部の実施形態では、RNAプログラマブルヌクレアーゼは、RNAと複合体を形成している場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNAは、ガイドRNA(gRNA)と称される。gRNAは、2つ以上のRNAの複合体として、または単一のRNA分子として存在し得る。単一のRNA分子として存在するgRNAは、シングルガイドRNA(sgRNA)と称され得るが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すように互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、2つのドメイン:(1)標的核酸と相同性を共有する(例えば、また、標的へのCas9複合体の結合を指示する)ドメイン、および(2)Cas9タンパク質に結合するドメインを含む。一部の実施形態では、ドメイン(2)は、tracrRNAとして知られる配列に対応し、ステム・ループ構造を含む。例えば、一部の実施形態では、ドメイン(2)は、Jinek et al.,Science 337:816-821(2012)に提供されるtracrRNAと同一または相同である(その内容全体が、参照により本明細書に援用される)。gRNAの他の例(例えば、ドメイン2を含むもの)は、「切替可能なCas9ヌクレアーゼとその使用」と題する2013年9月6日に出願された米国仮特許出願第61/874,682号、および「機能的ヌクレアーゼのための送達システム」と題する2013年9月6日に出願された米国仮特許出願第61/874,746号に見出すことができる(各々の内容全体が、参照によりそれらの全体が本明細書に援用される)。一部の実施形態では、gRNAは、ドメイン(1)および(2)のうちの2つ以上を含み、「伸長gRNA」と称され得る。例えば、伸長gRNAは、本明細書に記載されるように、2つ以上のCas9タンパク質に結合し、2つ以上の異なる領域で標的核酸に結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが、ヌクレアーゼ/RNA複合体の当該標的部位への結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
一部の実施形態では、RNAプログラマブルヌクレアーゼは、(CRISPR関連システム)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9(Csnl)である(例えば、“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti J.J.,et al.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)を参照されたい)。RNAプログラマブルヌクレアーゼ(例えば、Cas9)は、RNA:DNAハイブリダイゼーションを使用してDNA切断部位を標的化するため、これらのタンパク質は、原則として、ガイドRNAによって指定される任意の配列を標的化することができる。部位特異的切断のために(例えば、ゲノムを修飾するために)Cas9などのRNAプログラマブルヌクレアーゼを使用する方法は、当該技術分野で既知である(例えば、Cong,L.et al.,Multiplex genome engineering using CRISPR/Cas systems.Science 339,819-823(2013)、Mali,P.et al.,RNA-guided human genome engineering via Cas9.Science 339,823-826(2013)、Hwang,W.Y.et al.,Efficient genome editing in zebrafish using a CRISPR-Cas system.Nature biotechnology 31,227-229(2013)、Jinek,M.et al.,RNA-programmed genome editing in human cells.eLife 2,e00471(2013)、Dicarlo,J.E.et al.,Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems.Nucleic acids research(2013)、Jiang,W.et al.RNA-guided editing of bacterial genomes using CRISPR-Cas systems.Nature biotechnology 31,233-239(2013)を参照されたい。各々の内容全体が、参照により本明細書に援用される)。
「シグナル伝達ドメイン」とは、T細胞で発現するタンパク質の細胞内部分を意味し、これは、エフェクター機能シグナル(例えば、活性化シグナル)をT細胞に伝達し、特化した機能を行うようにT細胞に指示する。T細胞の活性化は、いくつかの要因によって誘導され得、同種抗原が、T細胞の表面上のT細胞受容体に結合すること、および同種リガンドが、T細胞の表面上の共刺激分子に結合すること、が含まれる。T細胞共刺激分子は、T細胞上の同種結合パートナーであり、共刺激リガンドと特異的に結合し、それによって、T細胞による共刺激応答(例えば、限定されないが、増殖)を媒介する。共刺激分子には、MHCクラスI分子が含まれるが、これらに限定されない。一部の実施形態では、共刺激ドメインは、CD2の細胞質ドメインである。T細胞の活性化は、免疫応答(例えば、T細胞の増殖および分化)につながる(例えば、Smith-Garvin et al.,Annu.Rev.Immunol.,27:591-619,2009を参照されたい)。例示的なT細胞シグナル伝達ドメインは、当該技術分野で既知である。非限定的な例としては、CD2、CD3ζ、CD8、CD28、CD27、CD154、GITR(TNFRSF18)、CD134(OX40)、およびCD137(4-1BB)のシグナル伝達ドメインが挙げられる。
「一本鎖抗体」または「scFv」とは、遺伝子的に融合された一本鎖分子として好適なポリペプチドリンカーによって連結された1つ以上の抗体のVHおよびVLドメインを含む、遺伝子操作された分子を意味する(例えば、Bird et al.,Science,242:423-426,1988;Huston et al.,Proc.Natl.Acad.Sci.,85:5879-5883,1988:Ahmad et al.,Clin.Dev.Immunol.,2012,doi:10.1155/2012/980250:Marbry,IDrugs,13:543-549,2010を参照されたい)。一部の実施形態では、scFvにおけるVHドメインおよびVLドメインの分子内配向は、VHドメイン-リンカードメイン-VLドメインである。一部の実施形態では、scFvにおけるVHドメインおよびVLドメインの分子内配向は、VLドメイン-リンカードメイン-VHドメインである。
「一塩基多型(SNP)」という用語は、ゲノムの特定の位置で生じる一塩基におけるバリエーションであり、各バリエーションは、集団内にある程度存在する(例えば、>1%)。例えば、ヒトゲノムの特定の塩基位置において、ほとんどの個体では、Cのヌクレオチドが現れ得るが、少数の個体では、その位置がAによって占められる。これは、この特定の位置にSNPが存在することを意味し、2つの可能なヌクレオチドのバリエーション(CまたはA)は、この位置について、アレルであると言われる。SNPは、疾患に対する感受性の違いの根底にある。病気の重症度および治療に対する私たちの身体の反応もまた、遺伝的バリエーションの現れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子間の領域)に含まれ得る。一部の実施形態では、コード配列内のSNPは、遺伝コードの縮重のため、必ずしも、産生されたタンパク質のアミノ酸配列を変化させるわけではない。コード領域のSNPは、同義SNPと非同義SNPの2種類がある。同義SNPは、タンパク質配列に影響を与えないが、非同義SNPは、タンパク質のアミノ酸配列を変化させる。非同義のSNPは、ミスセンスとナンセンスの2種類がある。タンパク質コード領域にないSNPは、遺伝子スプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に依然として影響を及ぼし得る。このタイプのSNPによって影響を受ける遺伝子発現は、eSNP(発現SNP)と称され、遺伝子の上流または下流にあり得る。一塩基バリアント(SNV)は、頻度の制限のない単一ヌクレオチドにおけるバリエーションであり、体細胞において生じ得る。体細胞の一塩基バリエーション(例えば、がんに関連付けられる)もまた、一塩基変化と呼ぶこともできる。
「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識し、結合するが、試料(例えば、生体試料)中の他の分子を実質的に認識せず、結合しない、核酸分子、ポリペプチド、またはその複合体(例えば、核酸プログラマブルDNA結合タンパク質、ガイド核酸、およびキメラ抗原受容体)、化合物、または分子を意味する。例えば、キメラ抗原受容体は、細胞の表面で発現された特定のマーカーと特異的に結合するが、他のポリペプチド、炭水化物、脂質、または細胞の表面上の任意の他の化合物とは結合しない。
本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。かかる核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列との「実質的な同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。かかる核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列との「実質的な同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、様々な厳密性の条件下で、相補ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)またはその一部の間に二本鎖分子を形成する対を意味する。(例えば、Wahl,G.M.and S.L.Berger(1987)Methods Enzymol.152:399、Kimmel,A.R.(1987)Methods Enzymol.152:507を参照されたい)。
例えば、厳密な塩濃度は、通常、約750mM未満のNaClおよび75mM未満のクエン酸三ナトリウムであり、好ましくは、約500mM未満のNaClおよび50mM未満のクエン酸三ナトリウムであり、より好ましくは、約250mM未満のNaClおよび25mM未満のクエン酸三ナトリウムである。低い厳密性のハイブリダイゼーションは、有機溶媒、例えば、ホルムアミドの不在下で得られ得るが、高い厳密性のハイブリダイゼーションは、少なくとも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下で得られ得る。厳密な温度条件には、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、および最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーションの時間、洗剤(例えば、ドデシル硫酸ナトリウム(SDS))の濃度、および担体DNAの包含または除外などの様々な追加のパラメータは、当業者に周知である。必要に応じて、これらの様々な条件を組み合わせることによって、様々なレベルの厳密性が達成される。一実施形態では、ハイブリダイゼーションは、750mMのNaCl、75mMのクエン酸三ナトリウム、および1%のSDS中で、30℃で行われる。別の実施形態では、ハイブリダイゼーションは、500mMのNaCl、50mMのクエン酸三ナトリウム、1%のSDS、35%のホルムアミド、および100μg/mLの変性サケ精子DNA(ssDNA)中で、37℃で行われる。別の実施形態では、ハイブリダイゼーションは、250mMのNaCl、25mMのクエン酸三ナトリウム、1%のSDS、50%のホルムアミド、および200μg/mLのssDNA中で、42℃で行われる。これらの条件における有用な変形は、当業者には明らかであろう。
ほとんどの用途において、ハイブリダイゼーションに続く洗浄ステップもまた、厳密性が異なるであろう。洗浄の厳密性の条件は、塩濃度および温度によって定義することができる。上記のように、洗浄の厳密性は、塩濃度を低下させることによって、または温度を上昇させることによって、増加させることができる。例えば、洗浄ステップのための厳密な塩濃度は、好ましくは約30mM未満のNaClおよび3mM未満のクエン酸三ナトリウム、および最も好ましくは約15mM未満のNaClおよび1.5mM未満のクエン酸三ナトリウムである。洗浄ステップのための厳密な温度条件には、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度が含まれる。一実施形態では、洗浄ステップは、30mMのNaCl、3mMのクエン酸三ナトリウム、および0.1%のSDS中で、25℃で行われる。より好ましい実施形態では、洗浄ステップは、15mMのNaCl、1.5mMのクエン酸三ナトリウム、および0.1%のSDS中で、42℃で行われる。より好ましい実施形態では、洗浄ステップは、15mMのNaCl、1.5mMのクエン酸三ナトリウム、および0.1%のSDS中で、68℃で行われる。これらの条件におけるさらなる変形は、当業者には明らかであろう。ハイブリダイゼーション技術は、当業者に周知であり、例えば、Benton and Davis(Science 196:180,1977)、Grunstein and Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975)、Ausubel et al.(Current Protocols in Molecular Biology,Wiley Interscience,New York,2001)、Berger and Kimmel(Guide to Molecular Cloning Techniques,1987,Academic Press,New York)、およびSambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,New Yorkに記載されている。
「スプリット(split)」は、2つ以上の断片に分割されることを意味する。
「スプリットCas9タンパク質」または「スプリットCas9」は、2つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質を指す。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドをスプライシングして、「再構築された」Cas9タンパク質を形成することができる。特定の実施形態では、Cas9タンパク質は、例えば、Nishimasu et al.,Cell,Volume 156,Issue 5,pp.935-949,2014,or as described in Jiang et al.(2016)Science 351:867-871.PDB file:5F9Rに記載されているように、タンパク質の無秩序領域内で2つの断片に分割される(その各々は、参照により本明細書に援用される)。一部の実施形態では、タンパク質は、約アミノ酸A292~G364、F445~K483、もしくはE565~T637の間のSpCas9の領域内の任意のC、T、A、もしくはSにおいて、または任意の他のCas9、Cas9バリアント(例えば、nCas9、dCas9)もしくは他のnapDNAbpにおける対応する位置において、2つの断片に分割される。一部の実施形態では、タンパク質は、SpCas9のT310、T313、A456、S469、またはC574において、2つの断片に分割される。一部の実施形態では、タンパク質を2つの断片に分割するプロセスは、タンパク質を「スプリットする」と称される。
他の実施形態では、Cas9タンパク質のN末端部分は、S.pyogenes Cas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)のアミノ酸1~573もしくは1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368もしくは638~1368の部分、またはそれらの対応する位置を含む。
スプリットCas9のC末端部分を、スプリットCas9のN末端部分と連結して、完全なCas9タンパク質を形成することができる。一部の実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。したがって、一部の実施形態では、スプリットCas9のC末端部分は、spCas9のアミノ酸(551~651)~1368の一部を含む。「(551~651)~1368」とは、アミノ酸551~651(境界値を含む)の間のアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、スプリットCas9のC末端部分は、spCas9のアミノ酸551~1368、552~1368、553~1368、554~1368、555~1368、556~1368、557~1368、558~1368、559~1368、560~1368、561~1368、562~1368、563~1368、564~1368、565~1368、566~1368、567~1368、568~1368、569~1368、570~1368、571~1368、572~1368、573~1368、574~1368、575~1368、576~1368、577~1368、578~1368、579~1368、580~1368、581~1368、582~1368、583~1368、584~1368、585~1368、586~1368、587~1368、588~1368、589~1368、590~1368、591~1368、592~1368、593~1368、594~1368、595~1368、596~1368、597~1368、598~1368、599~1368、600~1368、601~1368、602~1368、603~1368、604~1368、605~1368、606~1368、607~1368、608~1368、609~1368、610~1368、611~1368、612~1368、613~1368、614~1368、615~1368、616~1368、617~1368、618~1368、619~1368、620~1368、621~1368、622~1368、623~1368、624~1368、625~1368、626~1368、627~1368、628~1368、629~1368、630~1368、631~1368、632~1368、633~1368、634~1368、635~1368、636~1368、637~1368、638~1368、639~1368、640~1368、641~1368、642~1368、643~1368、644~1368、645~1368、646~1368、647~1368、648~1368、649~1368、650~1368、または651~1368のうちのいずれか1つの部分を含み得る。一部の実施形態では、スプリットCas9タンパク質のC末端部分は、SpCas9のアミノ酸574~1368または638~1368の一部分を含む。
「対象」とは、哺乳動物を意味し、ヒトまたは非ヒト哺乳動物(例えば、ウシ、ウマ、イヌ、ウシ、またはネコ)を含むが、これらに限定されない。対象には、家畜(livestock)、労働力を生み出し、食料などの商品を提供するために飼育された家畜(domesticated animal)が含まれ、ウシ、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジが挙げられるが、これらに限定されない。
「実質的に同一」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または参照核酸配列(例えば、本明細書に記載の核酸配列のうちのいずれか1つ)と、少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、かかる配列は、比較のために使用される配列と、アミノ酸レベルまたは核酸レベルで、少なくとも60%、80%または85%、90%、95%またはさらに99%同一である。
配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group(University of Wisconsin Biotechnology Center、1710 University Avenue,Madison,Wis.53705)の配列解析ソフトウェアパッケージ、BLAST、BESTFIT、COBALT、EMBOSS Needle、GAP、またはPILEUP/PRETTYBOXプログラム)を使用して測定される。このようなソフトウェアは、様々な置換、欠失、および/または他の修飾に対して相同性の程度を割り当てることによって、同一または類似の配列を一致させる。保存的置換は、典型的には、以下のグループ内の置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。同一性の程度を決定する例示的なアプローチでは、BLASTプログラムが使用され得、e-3~e-100の確率スコアは、密接に関連する配列を示す。
COBALTは、例えば、以下のパラメータで使用される。
a)整列パラメータ:ギャップペナルティ-11,-1およびエンドギャップペナルティ-5,-1、
b)CDDパラメータ:RPS BLASTを使用する;Blast E値0.003;保存された列を検索して再計算する、および
c)クエリクラスタリングパラメータ:クエリクラスタを使用する;ワードサイズ4;最大クラスタ距離0.8;アルファベット通常。
EMBOSS Needleは、例えば、以下のパラメータを用いて使用される。
a)マトリックス:BLOSUM62、
b)GAP OPEN:10、
c)GAP EXTEND:0.5、
d)OUTPUT FORMAT:pair、
e)END GAP PENALTY:false、
f)END GAP OPEN:10、および
g)END GAP EXTEND:0.5。
「標的部位」という用語は、核酸塩基エディターによって修飾される核酸分子内の配列を指す。一実施形態では、標的部位は、デアミナーゼまたはデアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ)を含む融合タンパク質によって脱アミノ化される。
「T細胞受容体α定常領域(TRAC)ポリペプチド」とは、NCBI受託番号P01848.2またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>sp|P01848.2|TRAC_HUMAN RecName:Full=T細胞受容体α定常領域
IQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS
「T細胞受容体α定常領域(TRAC)ポリヌクレオチド」とは、TRACポリペプチドをコードする核酸を意味する。例示的なTRAC核酸配列を以下に提供する。
UCSCヒトゲノムデータベース、遺伝子ENSG00000277734.8 ヒトT細胞受容体α鎖(TCR-α)
catgctaatcctccggcaaacctctgtttcctcctcaaaaggcaggaggtcggaaagaataaacaatgagagtcacattaaaaacacaaaatcctacggaaatactgaagaatgagtctcagcactaaggaaaagcctccagcagctcctgctttctgagggtgaaggatagacgctgtggctctgcatgactcactagcactctatcacggccatattctggcagggtcagtggctccaactaacatttgtttggtactttacagtttattaaatagatgtttatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattcattttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacggtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatctcctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccagcctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcctgcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagtattattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactgaaatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctggtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgcccttgtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccctgatcctcttgtcccacagATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGgtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttctgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccaccaaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagcagatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgcctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttgcctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcactcattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaagtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaagtccaaataacttcagattggaatgtgttttaactcagggttgagaaaacagctaccttcaggacaaaagtcagggaagggctctctgaagaaatgctacttgaagataccagccctaccaagggcagggagaggaccctatagaggcctgggacaggagctcaatgagaaaggagaagagcagcaggcatgagttgaatgaaggaggcagggccgggtcacagggccttctaggccatgagagggtagacagtattctaaggacgccagaaagctgttgatcggcttcaagcaggggagggacacctaatttgcttttcttttttttttttttttttttttttttttttgagatggagttttgctcttgttgcccaggctggagtgcaatggtgcatcttggctcactgcaacctccgcctcccaggttcaagtgattctcctgcctcagcctcccgagtagctgagattacaggcacccgccaccatgcctggctaattttttgtatttttagtagagacagggtttcactatgttggccaggctggtctcgaactcctgacctcaggtgatccacccgcttcagcctcccaaagtgctgggattacaggcgtgagccaccacacccggcctgcttttcttaaagatcaatctgagtgctgtacggagagtgggttgtaagccaagagtagaagcagaaagggagcagttgcagcagagagatgatggaggcctgggcagggtggtggcagggaggtaaccaacaccattcaggtttcaaaggtagaaccatgcagggatgagaaagcaaagaggggatcaaggaaggcagctggattttggcctgagcagctgagtcaatgatagtgccgtttactaagaagaaaccaaggaaaaaatttggggtgcagggatcaaaactttttggaacatatgaaagtacgtgtttatactctttatggcccttgtcactatgtatgcctcgctgcctccattggactctagaatgaagccaggcaagagcagggtctatgtgtgatggcacatgtggccagggtcatgcaacatgtactttgtacaaacagtgtatattgagtaaatagaaatggtgtccaggagccgaggtatcggtcctgccagggccaggggctctccctagcaggtgctcatatgctgtaagttccctccagatctctccacaaggaggcatggaaaggctgtagttgttcacctgcccaagaactaggaggtctggggtgggagagtcagcctgctctggatgctgaaagaatgtctgtttttccttttagAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGgtaagacaggggtctagcctgggtttgcacaggattgcggaagtgatgaacccgcaataaccctgcctggatgagggagtgggaagaaattagtagatgtgggaatgaatgatgaggaatggaaacagcggttcaagacctgcccagagctgggtggggtctctcctgaatccctctcaccatctctgactttccattctaagcactttgaggatgagtttctagcttcaatagaccaaggactctctcctaggcctctgtattcctttcaacagctccactgtcaagagagccagagagagcttctgggtggcccagctgtgaaatttctgagtcccttagggatagccctaaacgaaccagatcatcctgaggacagccaagaggttttgccttctttcaagacaagcaacagtactcacataggctgtgggcaatggtcctgtctctcaagaatcccctgccactcctcacacccaccctgggcccatattcatttccatttgagttgttcttattgagtcatccttcctgtggtagcggaactcactaaggggcccatctggacccgaggtattgtgatgataaattctgagcacctaccccatccccagaagggctcagaaataaaataagagccaagtctagtcggtgtttcctgtcttgaaacacaatactgttggccctggaagaatgcacagaatctgtttgtaaggggatatgcacagaagctgcaagggacaggaggtgcaggagctgcaggcctcccccacccagcctgctctgccttggggaaaaccgtgggtgtgtcctgcaggccatgcaggcctgggacatgcaagcccataaccgctgtggcctcttggttttacagATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGgtgaggggccttgaagctgggagtggggtttagggacgcgggtctctgggtgcatcctaagctctgagagcaaacctccctgcagggtcttgcttttaagtccaaagcctgagcccaccaaactctcctacttcttcctgttacaaattcctcttgtgcaataataatggcctgaaacgctgtaaaatatcctcatttcagccgcctcagttgcacttctcccctatgaggtaggaagaacagttgtttagaaacgaagaaactgaggccccacagctaatgagtggaggaagagagacacttgtgtacaccacatgccttgtgttgtacttctctcaccgtgtaacctcctcatgtcctctctccccagtacggctctcttagctcagtagaaagaagacattacactcatattacaccccaatcctggctagagtctccgcaccctcctcccccagggtccccagtcgtcttgctgacaactgcatcctgttccatcaccatcaaaaaaaaactccaggctgggtgcgggggctcacacctgtaatcccagcactttgggaggcagaggcaggaggagcacaggagctggagaccagcctgggcaacacagggagaccccgcctctacaaaaagtgaaaaaattaaccaggtgtggtgctgcacacctgtagtcccagctacttaagaggctgagatgggaggatcgcttgagccctggaatgttgaggctacaatgagctgtgattgcgtcactgcactccagcctggaagacaaagcaagatcctgtctcaaataataaaaaaaataagaactccagggtacatttgctcctagaactctaccacatagccccaaacagagccatcaccatcacatccctaacagtcctgggtcttcctcagtgtccagcctgacttctgttcttcctcattccagATCTGCAAGATTGTAAGACAGC

CTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGCAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGCAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTATCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAAGAGCAGA
上記の小文字のヌクレオチドは、非翻訳領域またはイントロンであり、大文字のヌクレオチドは、エキソンである。
>X02592.1T細胞受容体α鎖(TCR-α)のヒトmRNA
TTTTGAAACCCTTCAAAGGCAGAGACTTGTCCAGCCTAACCTGCCTGCTGCTCCTAGCTCCTGAGGCTCAGGGCCCTTGGCTTCTGTCCGCTCTGCTCAGGGCCCTCCAGCGTGGCCACTGCTCAGCCATGCTCCTGCTGCTCGTCCCAGTGCTCGAGGTGATTTTTACCCTGGGAGGAACCAGAGCCCAGTCGGTGACCCAGCTTGGCAGCCACGTCTCTGTCTCTGAAGGAGCCCTGGTTCTGCTGAGGTGCAACTACTCATCGTCTGTTCCACCATATCTCTTCTGGTATGTGCAATACCCCAACCAAGGACTCCAGCTTCTCCTGAAGTACACATCAGCGGCCACCCTGGTTAAAGGCATCAACGGTTTTGAGGCTGAATTTAAGAAGAGTGAAACCTCCTTCCACCTGACGAAACCCTCAGCCCATATGAGCGACGCGGCTGAGTACTTCTGTGCTGTGAGTGATCTCGAACCGAACAGCAGTGCTTCCAAGATAATCTTTGGATCAGGGACCAGACTCAGCATCCGGCCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGTAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGGAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTGTCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAA
「T細胞受容体β定常領域1ポリペプチド(TRBC1)」とは、NCBI受託番号P01850またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>sp|P01850|TRBC1_HUMAN T細胞受容体β定常領域1 OS=Homo sapiens OX=9606 GN=TRBC1 PE=1 SV=4
DLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF
「T細胞受容体β定常領域1ポリヌクレオチド(TRBC1)」とは、TRBC1ポリペプチドをコードする核酸を意味する。例示的なTRBC1核酸配列を以下に提供する。
>X00437.1
CTGGTCTAGAATATTCCACATCTGCTCTCACTCTGCCATGGACTCCTGGACCTTCTGCTGTGTGTCCCTTTGCATCCTGGTAGCGAAGCATACAGATGCTGGAGTTATCCAGTCACCCCGCCATGAGGTGACAGAGATGGGACAAGAAGTGACTCTGAGATGTAAACCAATTTCAGGCCACAACTCCCTTTTCTGGTACAGACAGACCATGATGCGGGGACTGGAGTTGCTCATTTACTTTAACAACAACGTTCCGATAGATGATTCAGGGATGCCCGAGGATCGATTCTCAGCTAAGATGCCTAATGCATCATTCTCCACTCTGAAGATCCAGCCCTCAGAACCCAGGGACTCAGCTGTGTACTTCTGTGCCAGCAGTTTCTCGACCTGTTCGGCTAACTATGGCTACACCTTCGGTTCGGGGACCAGGTTAACCGTTGTAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCATGCACACCTGCACACTCACGGCTGAAATCTCCCTAACCCAGGGGGAC
「T細胞受容体β定常領域2ポリペプチド(TRBC2)」とは、NCBI受託番号A0A5B9またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>sp|A0A5B9|TRBC2_HUMAN T細胞受容体β定常領域2 OS=Homo sapiens OX=9606 GN=TRBC2 PE=1 SV=2
DLKNVFPPKVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSESYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDSRG
「T細胞受容体β定常領域2ポリヌクレオチド(TRBC2)」とは、TRACポリペプチドをコードする核酸を意味する。例示的なTRBC2核酸配列を以下に提供する。
>NG_001333.2:655095-656583 Homo sapiens 染色体7上のT細胞受容体β遺伝子座(TRB)
AGGACCTGAAAAACGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTATGCCTGGCCACAGGCTTCTACCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGGTGAGTGGGGCCTGGGGAGATGCCTGGAGGAGATTAGGTGAGACCAGCTACCAGGGAAAATGGAAAGATCCAGGTAGCGGACAAGACTAGATCCAGAAGAAAGCCAGAGTGGACAAGGTGGGATGATCAAGGTTCACAGGGTCAGCAAAGCACGGTGTGCACTTCCCCCACCAAGAAGCATAGAGGCTGAATGGAGCACCTCAAGCTCATTCTTCCTTCAGATCCTGACACCTTAGAGCTAAGCTTTCAAGTCTCCCTGAGGACCAGCCATACAGCTCAGCATCTGAGTGGTGTGCATCCCATTCTCTTCTGGGGTCCTGGTTTCCTAAGATCATAGTGACCACTTCGCTGGCACTGGAGCAGCATGAGGGAGACAGAACCAGGGCTATCAAAGGAGGCTGACTTTGTACTATCTGATATGCATGTGTTTGTGGCCTGTGAGTCTGTGATGTAAGGCTCAATGTCCTTACAAAGCAGCATTCTCTCATCCATTTTTCTTCCCCTGTTTTCTTTCAGACTGTGGCTTCACCTCCGGTAAGTGAGTCTCTCCTTTTTCTCTCTATCTTTCGCCGTCTCTGCTCTCGAACCAGGGCATGGAGAATCCACGGACACAGGGGCGTGAGGGAGGCCAGAGCCACCTGTGCACAGGTGCCTACATGCTCTGTTCTTGTCAACAGAGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTAAGGAGGAGGGTGGGATAGGGCAGATGATGGGGGCAGGGGATGGAACATCACACATGGGCATAAAGGAATCTCAGAGCCAGAGCACAGCCTAATATATCCTATCACCTCAATGAAACCATAATGAAGCCAGACTGGGGAGAAAATGCAGGGAATATCACAGAATGCATCATGGGAGGATGGAGACAACCAGCGAGCCCTACTCAAATTAGGCCTCAGAGCCCGCCTCCCCTGCCCTACTCCTGCTGTGCCATAGCCCCTGAAACCCTGAAAATGTTCTCTCTTCCACAGGTCAAGAGAAAGGATTCCAGAGGCTAG
「5-メチルシトシンジオキシゲナーゼ2(TET2)ポリペプチド」とは、NCBI受託番号FM992369.1またはその断片と少なくとも約85%のアミノ酸配列同一性を有し、メチルシトシンを5-ヒドロキシメチルシトシンに変換する触媒活性を有するタンパク質を意味する。遺伝子の欠陥は骨髄増殖性障害と関連しており、酵素がシトシンをメチル化する能力は転写調節に寄与する。例示的なTET2アミノ酸配列を以下に提供する。
>CAX30492.1 tetがん遺伝子ファミリーメンバー2[Homo sapiens]
MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSYYGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANGERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSIAVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADDADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNLQAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPSEGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERPQNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEILKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQMTSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHLVSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSYSASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRLPPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKMLPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAKMAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTTDSTVTTSPYAFTRVTGPYNRYI
「5-メチルシトシンジオキシゲナーゼ2(TET2)ポリヌクレオチド」とは、TET2ポリペプチドをコードする核酸分子を意味する。TETポリペプチドは、メチルシトシンジオキシゲナーゼをコードし、転写調節活性を有する。例示的なTET2核酸を以下に提示する。
>FM992369.1 tetがん遺伝子ファミリーメンバー2(TET2遺伝子)のHomo sapiens mRNA
CCGTGCCATCCCAACCTCCCACCTCGCCCCCAACCTTCGCGCTTGCTCTGCTTCTTCTCCCAGGGGTGGAGACCCGCCGAGGTCCCCGGGGTTCCCGAGGGCTGCACCCTTCCCCGCGCTCGCCAGCCCTGGCCCCTACTCCGCGCTGGTCCGGGCGCACCACTCCCCCCGCGCCACTGCACGGCGTGAGGGCAGCCCAGGTCTCCACTGCGCGCCCCGCTGTACGGCCCCAGGTGCCGCCGGCCTTTGTGCTGGACGCCCGGTGCGGGGGGCTAATTCCCTGGGAGCCGGGGCTGAGGGCCCCAGGGCGGCGGCGCAGGCCGGGGCGGAGCGGGAGGAGGCCGGGGCGGAGCAGGAGGAGGCCCGGGCGGAGGAGGAGAGCCGGCGGTAGCGGCAGTGGCAGCGGCGAGAGCTTGGGCGGCCGCCGCCGCCTCCTCGCGAGCGCCGCGCGCCCGGGTCCCGCTCGCATGCAAGTCACGTCCGCCCCCTCGGCGCGGCCGCCCCGAGACGCCGGCCCCGCTGAGTGATGAGAACAGACGTCAAACTGCCTTATGAATATTGATGCGGAGGCTAGGCTGCTTTCGTAGAGAAGCAGAAGGAAGCAAGATGGCTGCCCTTTAGGATTTGTTAGAAAGGAGACCCGACTGCAACTGCTGGATTGCTGCAAGGCTGAGGGACGAGAACGAGGCTGGCAAACATTCAGCAGCACACCCTCTCAAGATTGTTTACTTGCCTTTGCTCCTGTTGAGTTACAACGCTTGGAAGCAGGAGATGGGCTCAGCAGCAGCCAATAGGACATGATCCAGGAAGAGCAAATTCAACTAGAGGGCAGCCTTGTGGATGGCCCCGAAGCAAGCCTGATGGAACAGGATAGAACCAACCATGTTGAGGGCAACAGACTAAGTCCATTCCTGATACCATCACCTCCCATTTGCCAGACAGAACCTCTGGCTACAAAGCTCCAGAATGGAAGCCCACTGCCTGAGAGAGCTCATCCAGAAGTAAATGGAGACACCAAGTGGCACTCTTTCAAAAGTTATTATGGAATACCCTGTATGAAGGGAAGCCAGAATAGTCGTGTGAGTCCTGACTTTACACAAGAAAGTAGAGGGTATTCCAAGTGTTTGCAAAATGGAGGAATAAAACGCACAGTTAGTGAACCTTCTCTCTCTGGGCTCCTTCAGATCAAGAAATTGAAACAAGACCAAAAGGCTAATGGAGAAAGACGTAACTTCGGGGTAAGCCAAGAAAGAAATCCAGGTGAAAGCAGTCAACCAAATGTCTCCGATTTGAGTGATAAGAAAGAATCTGTGAGTTCTGTAGCCCAAGAAAATGCAGTTAAAGATTTCACCAGTTTTTCAACACATAACTGCAGTGGGCCTGAAAATCCAGAGCTTCAGATTCTGAATGAGCAGGAGGGGAAAAGTGCTAATTACCATGACAAGAACATTGTATTACTTAAAAACAAGGCAGTGCTAATGCCTAATGGTGCTACAGTTTCTGCCTCTTCCGTGGAACACACACATGGTGAACTCCTGGAAAAAACACTGTCTCAATATTATCCAGATTGTGTTTCCATTGCGGTGCAGAAAACCACATCTCACATAAATGCCATTAACAGTCAGGCTACTAATGAGTTGTCCTGTGAGATCACTCACCCATCGCATACCTCAGGGCAGATCAATTCCGCACAGACCTCTAACTCTGAGCTGCCTCCAAAGCCAGCTGCAGTGGTGAGTGAGGCCTGTGATGCTGATGATGCTGATAATGCCAGTAAACTAGCTGCAATGCTAAATACCTGTTCCTTTCAGAAACCAGAACAACTACAACAACAAAAATCAGTTTTTGAGATATGCCCATCTCCTGCAGAAAATAACATCCAGGGAACCACAAAGCTAGCGTCTGGTGAAGAATTCTGTTCAGGTTCCAGCAGCAATTTGCAAGCTCCTGGTGGCAGCTCTGAACGGTATTTAAAACAAAATGAAATGAATGGTGCTTACTTCAAGCAAAGCTCAGTGTTCACTAAGGATTCCTTTTCTGCCACTACCACACCACCACCACCATCACAATTGCTTCTTTCTCCCCCTCCTCCTCTTCCACAGGTTCCTCAGCTTCCTTCAGAAGGAAAAAGCACTCTGAATGGTGGAGTTTTAGAAGAACACCACCACTACCCCAACCAAAGTAACACAACACTTTTAAGGGAAGTGAAAATAGAGGGTAAACCTGAGGCACCACCTTCCCAGAGTCCTAATCCATCTACACATGTATGCAGCCCTTCTCCGATGCTTTCTGAAAGGCCTCAGAATAATTGTGTGAACAGGAATGACATACAGACTGCAGGGACAATGACTGTTCCATTGTGTTCTGAGAAAACAAGACCAATGTCAGAACACCTCAAGCATAACCCACCAATTTTTGGTAGCAGTGGAGAGCTACAGGACAACTGCCAGCAGTTGATGAGAAACAAAGAGCAAGAGATTCTGAAGGGTCGAGACAAGGAGCAAACACGAGATCTTGTGCCCCCAACACAGCACTATCTGAAACCAGGATGGATTGAATTGAAGGCCCCTCGTTTTCACCAAGCGGAATCCCATCTAAAACGTAATGAGGCATCACTGCCATCAATTCTTCAGTATCAACCCAATCTCTCCAATCAAATGACCTCCAAACAATACACTGGAAATTCCAACATGCCTGGGGGGCTCCCAAGGCAAGCTTACACCCAGAAAACAACACAGCTGGAGCACAAGTCACAAATGTACCAAGTTGAAATGAATCAAGGGCAGTCCCAAGGTACAGTGGACCAACATCTCCAGTTCCAAAAACCCTCACACCAGGTGCACTTCTCCAAAACAGACCATTTACCAAAAGCTCATGTGCAGTCACTGTGTGGCACTAGATTTCATTTTCAACAAAGAGCAGATTCCCAAACTGAAAAACTTATGTCCCCAGTGTTGAAACAGCACTTGAATCAACAGGCTTCAGAGACTGAGCCATTTTCAAACTCACACCTTTTGCAACATAAGCCTCATAAACAGGCAGCACAAACACAACCATCCCAGAGTTCACATCTCCCTCAAAACCAGCAACAGCAGCAAAAATTACAAATAAAGAATAAAGAGGAAATACTCCAGACTTTTCCTCACCCCCAAAGCAACAATGATCAGCAAAGAGAAGGATCATTCTTTGGCCAGACTAAAGTGGAAGAATGTTTTCATGGTGAAAATCAGTATTCAAAATCAAGCGAGTTCGAGACTCATAATGTCCAAATGGGACTGGAGGAAGTACAGAATATAAATCGTAGAAATTCCCCTTATAGTCAGACCATGAAATCAAGTGCATGCAAAATACAGGTTTCTTGTTCAAACAATACACACCTAGTTTCAGAGAATAAAGAACAGACTACACATCCTGAACTTTTTGCAGGAAACAAGACCCAAAACTTGCATCACATGCAATATTTTCCAAATAATGTGATCCCAAAGCAAGATCTTCTTCACAGGTGCTTTCAAGAACAGGAGCAGAAGTCACAACAAGCTTCAGTTCTACAGGGATATAAAAATAGAAACCAAGATATGTCTGGTCAACAAGCTGCGCAACTTGCTCAGCAAAGGTACTTGATACATAACCATGCAAATGTTTTTCCTGTGCCTGACCAGGGAGGAAGTCACACTCAGACCCCTCCCCAGAAGGACACTCAAAAGCATGCTGCTCTAAGGTGGCATCTCTTACAGAAGCAAGAACAGCAGCAAACACAGCAACCCCAAACTGAGTCTTGCCATAGTCAGATGCACAGGCCAATTAAGGTGGAACCTGGATGCAAGCCACATGCCTGTATGCACACAGCACCACCAGAAAACAAAACATGGAAAAAGGTAACTAAGCAAGAGAATCCACCTGCAAGCTGTGATAATGTGCAGCAAAAGAGCATCATTGAGACCATGGAGCAGCATCTGAAGCAGTTTCACGCCAAGTCGTTATTTGACCATAAGGCTCTTACTCTCAAATCACAGAAGCAAGTAAAAGTTGAAATGTCAGGGCCAGTCACAGTTTTGACTAGACAAACCACTGCTGCAGAACTTGATAGCCACACCCCAGCTTTAGAGCAGCAAACAACTTCTTCAGAAAAGACACCAACCAAAAGAACAGCTGCTTCTGTTCTCAATAATTTTATAGAGTCACCTTCCAAATTACTAGATACTCCTATAAAAAATTTATTGGATACACCTGTCAAGACTCAATATGATTTCCCATCTTGCAGATGTGTAGAGCAAATTATTGAAAAAGATGAAGGTCCTTTTTATACCCATCTAGGAGCAGGTCCTAATGTGGCAGCTATTAGAGAAATCATGGAAGAAAGGTTTGGACAGAAGGGTAAAGCTATTAGGATTGAAAGAGTCATCTATACTGGTAAAGAAGGCAAAAGTTCTCAGGGATGTCCTATTGCTAAGTGGGTGGTTCGCAGAAGCAGCAGTGAAGAGAAGCTACTGTGTTTGGTGCGGGAGCGAGCTGGCCACACCTGTGAGGCTGCAGTGATTGTGATTCTCATCCTGGTGTGGGAAGGAATCCCGCTGTCTCTGGCTGACAAACTCTACTCGGAGCTTACCGAGACGCTGAGGAAATACGGCACGCTCACCAATCGCCGGTGTGCCTTGAATGAAGAGAGAACTTGCGCCTGTCAGGGGCTGGATCCAGAAACCTGTGGTGCCTCCTTCTCTTTTGGTTGTTCATGGAGCATGTACTACAATGGATGTAAGTTTGCCAGAAGCAAGATCCCAAGGAAGTTTAAGCTGCTTGGGGATGACCCAAAAGAGGAAGAGAAACTGGAGTCTCATTTGCAAAACCTGTCCACTCTTATGGCACCAACATATAAGAAACTTGCACCTGATGCATATAATAATCAGATTGAATATGAACACAGAGCACCAGAGTGCCGTCTGGGTCTGAAGGAAGGCCGTCCATTCTCAGGGGTCACTGCATGTTTGGACTTCTGTGCTCATGCCCACAGAGACTTGCACAACATGCAGAATGGCAGCACATTGGTATGCACTCTCACTAGAGAAGACAATCGAGAATTTGGAGGAAAACCTGAGGATGAGCAGCTTCACGTTCTGCCTTTAT

ACAAAGTCTCTGACGTGGATGAGTTTGGGAGTGTGGAAGCTCAGGAGGAGAAAAAACGGAGTGGTGCCATTCAGGTACTGAGTTCTTTTCGGCGAAAAGTCAGGATGTTAGCAGAGCCAGTCAAGACTTGCCGACAAAGGAAACTAGAAGCCAAGAAAGCTGCAGCTGAAAAGCTTTCCTCCCTGGAGAACAGCTCAAATAAAAATGAAAAGGAAAAGTCAGCCCCATCACGTACAAAACAAACTGAAAACGCAAGCCAGGCTAAACAGTTGGCAGAACTTTTGCGACTTTCAGGACCAGTCATGCAGCAGTCCCAGCAGCCCCAGCCTCTACAGAAGCAGCCACCACAGCCCCAGCAGCAGCAGAGACCCCAGCAGCAGCAGCCACATCACCCTCAGACAGAGTCTGTCAACTCTTATTCTGCTTCTGGATCCACCAATCCATACATGAGACGGCCCAATCCAGTTAGTCCTTATCCAAACTCTTCACACACTTCAGATATCTATGGAAGCACCAGCCCTATGAACTTCTATTCCACCTCATCTCAAGCTGCAGGTTCATATTTGAATTCTTCTAATCCCATGAACCCTTACCCTGGGCTTTTGAATCAGAATACCCAATATCCATCATATCAATGCAATGGAAACCTATCAGTGGACAACTGCTCCCCATATCTGGGTTCCTATTCTCCCCAGTCTCAGCCGATGGATCTGTATAGGTATCCAAGCCAAGACCCTCTGTCTAAGCTCAGTCTACCACCCATCCATACACTTTACCAGCCAAGGTTTGGAAATAGCCAGAGTTTTACATCTAAATACTTAGGTTATGGAAACCAAAATATGCAGGGAGATGGTTTCAGCAGTTGTACCATTAGACCAAATGTACATCATGTAGGGAAATTGCCTCCTTATCCCACTCATGAGATGGATGGCCACTTCATGGGAGCCACCTCTAGATTACCACCCAATCTGAGCAATCCAAACATGGACTATAAAAATGGTGAACATCATTCACCTTCTCACATAATCCATAACTACAGTGCAGCTCCGGGCATGTTCAACAGCTCTCTTCATGCCCTGCATCTCCAAAACAAGGAGAATGACATGCTTTCCCACACAGCTAATGGGTTATCAAAGATGCTTCCAGCTCTTAACCATGATAGAACTGCTTGTGTCCAAGGAGGCTTACACAAATTAAGTGATGCTAATGGTCAGGAAAAGCAGCCATTGGCACTAGTCCAGGGTGTGGCTTCTGGTGCAGAGGACAACGATGAGGTCTGGTCAGACAGCGAGCAGAGCTTTCTGGATCCTGACATTGGGGGAGTGGCCGTGGCTCCAACTCATGGGTCAATTCTCATTGAGTGTGCAAAGCGTGAGCTGCATGCCACAACCCCTTTAAAGAATCCCAATAGGAATCACCCCACCAGGATCTCCCTCGTCTTTTACCAGCATAAGAGCATGAATGAGCCAAAACATGGCTTGGCTCTTTGGGAAGCCAAAATGGCTGAAAAAGCCCGTGAGAAAGAGGAAGAGTGTGAAAAGTATGGCCCAGACTATGTGCCTCAGAAATCCCATGGCAAAAAAGTGAAACGGGAGCCTGCTGAGCCACATGAAACTTCAGAGCCCACTTACCTGCGTTTCATCAAGTCTCTTGCCGAAAGGACCATGTCCGTGACCACAGACTCCACAGTAACTACATCTCCATATGCCTTCACTCGGGTCACAGGGCCTTACAACAGATATATATGAAGATATATATGATATCACCCCCTTTTGTTGGTTACCTCACTTGAAAAGACCACAACCAACCTGTCAGTAGTATAGTTCTCATGACGTGGGCAGTGGGGAAAGGTCACAGTATTCATGACAAATGTGGTGGGAAAAACCTCAGCTCACCAGCAACAAAAGAGGTTATCTTACCATAGCACTTAATTTTCACTGGCTCCCAAGTGGTCACAGATGGCATCTAGGAAAAGACCAAAGCATTCTATGCAAAAAGAAGGTGGGGAAGAAAGTGTTCCGCAATTTACATTTTTAAACACTGGTTCTATTATTGGACGAGATGATATGTAAATGTGATCCCCCCCCCCCGCTTACAACTCTACACATCTGTGACCACTTTTAATAATATCAAGTTTGCATAGTCATGGAACACAAATCAAACAAGTACTGTAGTATTACAGTGACAGGAATCTTAAAATACCATCTGGTGCTGAATATATGATGTACTGAAATACTGGAATTATGGCTTTTTGAAATGCAGTTTTTACTGTAATCTTAACTTTTATTTATCAAAATAGCTACAGGAAACATGAATAGCAGGAAAACACTGAATTTGTTTGGATGTTCTAAGAAATGGTGCTAAGAAAATGGTGTCTTTAATAGCTAAAAATTTAATGCCTTTATATCATCAAGATGCTATCAGTGTACTCCAGTGCCCTTGAATAATAGGGGTACCTTTTCATTCAAGTTTTTATCATAATTACCTATTCTTACACAAGCTTAGTTTTTAAAATGTGGACATTTTAAAGGCCTCTGGATTTTGCTCATCCAGTGAAGTCCTTGTAGGACAATAAACGTATATATGTACATATATACACAAACATGTATATGTGCACACACATGTATATGTATAAATATTTTAAATGGTGTTTTAGAAGCACTTTGTCTACCTAAGCTTTGACAACTTGAACAATGCTAAGGTACTGAGATGTTTAAAAAACAAGTTTACTTTCATTTTAGAATGCAAAGTTGATTTTTTTAAGGAAACAAAGAAAGCTTTTAAAATATTTTTGCTTTTAGCCATGCATCTGCTGATGAGCAATTGTGTCCATTTTTAACACAGCCAGTTAAATCCACCATGGGGCTTACTGGATTCAAGGGAATACGTTAGTCCACAAAACATGTTTTCTGGTGCTCATCTCACATGCTATACTGTAAAACAGTTTTATACAAAATTGTATGACAAGTTCATTGCTCAAAAATGTACAGTTTTAAGAATTTTCTATTAACTGCAGGTAATAATTAGCTGCATGCTGCAGACTCAACAAAGCTAGTTCACTGAAGCCTATGCTATTTTATGGATCATAGGCTCTTCAGAGAACTGAATGGCAGTCTGCCTTTGTGTTGATAATTATGTACATTGTGACGTTGTCATTTCTTAGCTTAAGTGTCCTCTTTAACAAGAGGATTGAGCAGACTGATGCCTGCATAAGATGAATAAACAGGGTTAGTTCCATGTGAATCTGTCAGTTAAAAAGAAACAAAAACAGGCAGCTGGTTTGCTGTGGTGGTTTTAAATCATTAATTTGTATAAAGAAGTGAAAGAGTTGTATAGTAAATTAAATTGTAAACAAAACTTTTTTAATGCAATGCTTTAGTATTTTAGTACTGTAAAAAAATTAAATATATACATATATATATATATATATATATATATATATATGAGTTTGAAGCAGAATTCACATCATGATGGTGCTACTCAGCCTGCTACAAATATATCATAATGTGAGCTAAGAATTCATTAAATGTTTGAGTGATGTTCCTACTTGTCATATACCTCAACACTAGTTTGGCAATAGGATATTGAACTGAGAGTGAAAGCATTGTGTACCATCATTTTTTTCCAAGTCCTTTTTTTTATTGTTAAAAAAAAAAGCATACCTTTTTTCAATACTTGATTTCTTAGCAAGTATAACTTGAACTTCAACCTTTTTGTTCTAAAAATTCAGGGATATTTCAGCTCATGCTCTCCCTATGCCAACATGTCACCTGTGTTTATGTAAAATTGTTGTAGGTTAATAAATATATTCTTTGTCAGGGATTTAACCCTTTTATTTTGAATCCCTTCTATTTTACTTGTACATGTGCTGATGTAACTAAAACTAATTTTGTAAATCTGTTGGCTCTTTTTATTGTAAAGAAAAGCATTTTAAAAGTTTGAGGAATCTTTTGACTGTTTCAAGCAGGAAAAAAAAATTACATGAAAATAGAATGCACTGAGTTGATAAAGGGAAAAATTGTAAGGCAGGAGTTTGGCAAGTGGCTGTTGGCCAGAGACTTACTTGTAACTCTCTAAATGAAGTTTTTTTGATCCTGTAATCACTGAAGGTACATACTCCATGTGGACTTCCCTTAAACAGGCAAACACCTACAGGTATGGTGTGCAACAGATTGTACAATTACATTTTGGCCTAAATACATTTTTGCTTACTAGTATTTAAAATAAATTCTTAATCAGAGGAGGCCTTTGGGTTTTATTGGTCAAATCTTTGTAAGCTGGCTTTTGTCTTTTTAAAAAATTTCTTGAATTTGTGGTTGTGTCCAATTTGCAAACATTTCCAAAAATGTTTGCTTTGCTTACAAACCACATGATTTTAATGTTTTTTGTATACCATAATATCTAGCCCCAAACATTTGATTACTACATGTGCATTGGTGATTTTGATCATCCATTCTTAATATTTGATTTCTGTGTCACCTACTGTCATTTGTTAAACTGCTGGCCAACAAGAACAGGAAGTATAGTTTGGGGGGTTGGGGAGAGTTTACATAAGGAAGAGAAGAAATTGAGTGGCATATTGTAAATATCAGATCTATAATTGTAAATATAAAACCTGCCTCAGTTAGAATGAATGGAAAGCAGATCTACAATTTGCTAATATAGGAATATCAGGTTGACTATATAGCCATACTTGAAAATGCTTCTGAGTGGTGTCAACTTTACTTGAATGAATTTTTCATCTTGATTGACGCACAGTGATGTACAGTTCACTTCTGAAGCTAGTGGTTAACTTGTGTAGGAAACTTTTGCAGTTTGACACTAAGATAACTTCTGTGTGCATTTTTCTATGCTTTTTTAAAAACTAGTTTCATTTCATTTTCATGAGATGTTTGGTTTATAAGATCTGAGGATGGTTATAAATACTGTAAGTATTGTAATGTTATGAATGCAGGTTATTTGAAAGCTGTTTATTATTATATCATTCCTGATAATGCTATGTGAGTGTTTTTAATAAAATTTATATTTATTTAATGCACTCTAAGTGTTGTCTTCCT
「形質転換増殖因子受容体2(TGFBRII)ポリペプチド」とは、NCBI受託番号ABG65632.1またはその断片と少なくとも約85%の配列同一性を有し、免疫抑制活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>ABG65632.1 形質転換増殖因子β受容体II[Homo sapiens]
MGRGLLRGLWPLHIVLWTRIASTIPPHVQKSVNNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQVTGISLLPPLGVAISVIIIFYCYRVNRQQKLSSTWETGKTRKLMEFSEHCAIILEDDRSDISSTCANNINHNTELLPIELDTLVGKGRFAEVYKAKLKQNTSEQFETVAVKIFPYEEYASWKTEKDIFSDINLKHENILQFLTAEERKTELGKQYWLITAFHAKGNLQEYLTRHVISWEDLRKLGSSLARGIAHLHSDHTPCGRPKMPIVHRDLKSSNILVKNDLTCCLCDFGLSLRLDPTLSVDDLANSGQVGTARYMAPEVLESRMNLENVESFKQTDVYSMALVLWEMTSRCNAVGEVKDYEPPFGSKVREHPCVESMKDNVLRDRGRPEIPSFWLNHQGIQMVCETLTECWDHDPEARLTAQCVAERFSELEHLDRLSGRSCSEEKIPEDGSLNTTK
「形質転換増殖因子受容体2(TGFBRII)ポリヌクレオチド」とは、TGFBRIIポリペプチドをコードする核酸を意味する。TGFBRII遺伝子は、セリン/スレオニンキナーゼ活性を有する膜貫通タンパク質をコードする。例示的なTGFBRII核酸を以下に提供する。
M85079.1 ヒトTGF-βII型受容体mRNA、完全長CDS
GTTGGCGAGGAGTTTCCTGTTTCCCCCGCAGCGCTGAGTTGAAGTTGAGTGAGTCACTCGCGCGCACGGAGCGACGACACCCCCGCGCGTGCACCCGCTCGGGACAGGAGCCGGACTCCTGTGCAGCTTCCCTCGGCCGCCGGGGGCCTCCCCGCGCCTCGCCGGCCTCCAGGCCCCTCCTGGCTGGCGAGCGGGCGCCACATCTGGCCCGCACATCTGCGCTGCCGGCCCGGCGCGGGGTCCGGAGAGGGCGCGGCGCGGAGCGCAGCCAGGGGTCCGGGAAGGCGCCGTCCGTGCGCTGGGGGCTCGGTCTATGACGAGCAGCGGGGTCTGCCATGGGTCGGGGGCTGCTCAGGGGCCTGTGGCCGCTGCACATCGTCCTGTGGACGCGTATCGCCAGCACGATCCCACCGCACGTTCAGAAGTCGGTTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAAGTGACAGGCATCAGCCTCCTGCCACCACTGGGAGTTGCCATATCTGTCATCATCATCTTCTACTGCTACCGCGTTAACCGGCAGCAGAAGCTGAGTTCAACCTGGGAAACCGGCAAGACGCGGAAGCTCATGGAGTTCAGCGAGCACTGTGCCATCATCCTGGAAGATGACCGCTCTGACATCAGCTCCACGTGTGCCAACAACATCAACCACAACACAGAGCTGCTGCCCATTGAGCTGGACACCCTGGTGGGGAAAGGTCGCTTTGCTGAGGTCTATAAGGCCAAGCTGAAGCAGAACACTTCAGAGCAGTTTGAGACAGTGGCAGTCAAGATCTTTCCCTATGAGGAGTATGCCTCTTGGAAGACAGAGAAGGACATCTTCTCAGACATCAATCTGAAGCATGAGAACATACTCCAGTTCCTGACGGCTGAGGAGCGGAAGACGGAGTTGGGGAAACAATACTGGCTGATCACCGCCTTCCACGCCAAGGGCAACCTACAGGAGTACCTGACGCGGCATGTCATCAGCTGGGAGGACCTGCGCAAGCTGGGCAGCTCCCTCGCCCGGGGGATTGCTCACCTCCACAGTGATCACACTCCATGTGGGAGGCCCAAGATGCCCATCGTGCACAGGGACCTCAAGAGCTCCAATATCCTCGTGAAGAACGACCTAACCTGCTGCCTGTGTGACTTTGGGCTTTCCCTGCGTCTGGACCCTACTCTGTCTGTGGATGACCTGGCTAACAGTGGGCAGGTGGGAACTGCAAGATACATGGCTCCAGAAGTCCTAGAATCCAGGATGAATTTGGAGAATGCTGAGTCCTTCAAGCAGACCGATGTCTACTCCATGGCTCTGGTGCTCTGGGAAATGACATCTCGCTGTAATGCAGTGGGAGAAGTAAAAGATTATGAGCCTCCATTTGGTTCCAAGGTGCGGGAGCACCCCTGTGTCGAAAGCATGAAGGACAACGTGTTGAGAGATCGAGGGCGACCAGAAATTCCCAGCTTCTGGCTCAACCACCAGGGCATCCAGATGGTGTGTGAGACGTTGACTGAGTGCTGGGACCACGACCCAGAGGCCCGTCTCACAGCCCAGTGTGTGGCAGAACGCTTCAGTGAGCTGGAGCATCTGGACAGGCTCTCGGGGAGGAGCTGCTCGGAGGAGAAGATTCCTGAAGACGGCTCCCTAAACACTACCAAATAGCTCTTATGGGGCAGGCTGGGCATGTCCAAAGAGGCTGCCCCTCTCACCAAA
「IgおよびITIMドメインを有するT細胞免疫受容体(TIGIT)ポリペプチド」とは、NCBI受託番号ACD74757.1と少なくとも約85%の配列同一性を有し、免疫調節活性を有するタンパク質を意味する。例示的なTIGITアミノ酸配列を以下に提供する。
>ACD74757.1 IgおよびITIMドメインを有するT細胞免疫受容体[Homo sapiens]
MRWCLLLIWAQGLRQAPLASGMMTGTIETTGNISAEKGGSIILQCHLSSTTAQVTQVNWEQQDQLLAICNADLGWHISPSFKDRVAPGPGLGLTLQSLTVNDTGEYFCIYHTYPDGTYTGRIFLEVLESSVAEHGARFQIPLLGAMAATLVVICTAVIVVVALTRKKKALRIHSVEGDLRRKSAGQEEWSPSAPSPPGSCVQAEAAPAGLCGEQRGEDCAELHDYFNVLSYRSLGNCSFFTETG
「IgおよびITIMドメインを有するT細胞免疫受容体(TIGIT)ポリヌクレオチド」とは、TIGITポリペプチドをコードする核酸を意味する。TIGIT遺伝子は、腫瘍およびT細胞枯渇に関連する抑制性免疫受容体をコードする。例示的な核酸配列を以下に提供する。
EU675310.1 Homo sapiens IgおよびITIMドメインを有するT細胞免疫受容体(TIGIT)mRNA、完全長CDS
CGTCCTATCTGCAGTCGGCTACTTTCAGTGGCAGAAGAGGCCACATCTGCTTCCTGTAGGCCCTCTGGGCAGAAGCATGCGCTGGTGTCTCCTCCTGATCTGGGCCCAGGGGCTGAGGCAGGCTCCCCTCGCCTCAGGAATGATGACAGGCACAATAGAAACAACGGGGAACATTTCTGCAGAGAAAGGTGGCTCTATCATCTTACAATGTCACCTCTCCTCCACCACGGCACAAGTGACCCAGGTCAACTGGGAGCAGCAGGACCAGCTTCTGGCCATTTGTAATGCTGACTTGGGGTGGCACATCTCCCCATCCTTCAAGGATCGAGTGGCCCCAGGTCCCGGCCTGGGCCTCACCCTCCAGTCGCTGACCGTGAACGATACAGGGGAGTACTTCTGCATCTATCACACCTACCCTGATGGGACGTACACTGGGAGAATCTTCCTGGAGGTCCTAGAAAGCTCAGTGGCTGAGCACGGTGCCAGGTTCCAGATTCCATTGCTTGGAGCCATGGCCGCGACGCTGGTGGTCATCTGCACAGCAGTCATCGTGGTGGTCGCGTTGACTAGAAAGAAGAAAGCCCTCAGAATCCATTCTGTGGAAGGTGACCTCAGGAGAAAATCAGCTGGACAGGAGGAATGGAGCCCCAGTGCTCCCTCACCCCCAGGAAGCTGTGTCCAGGCAGAAGCTGCACCTGCTGGGCTCTGTGGAGAGCAGCGGGGAGAGGACTGTGCCGAGCTGCATGACTACTTCAATGTCCTGAGTTACAGAAGCCTGGGTAACTGCAGCTTCTTCACAGAGACTGGTTAGCAACCAGAGGCATCTTCTGG
本明細書で使用される場合、「形質導入」は、遺伝子または遺伝物質を、ウイルスベクターを介して細胞に移すことを意味する。
「形質転換」は、本明細書で使用される場合、細胞に遺伝子変化を導入するプロセスを指し、外因性核酸の導入によってもたらされる。
「トランスフェクション」は、遺伝子または遺伝物質を、化学的手段または物理的手段を介して細胞に移すことを指す。
「転座」とは、非相同染色体間の核酸セグメントの再編成を意味する。
「膜貫通ドメイン」とは、脂質二重層(例えば、細胞またはウイルスもしくはウイルス様粒子の脂質二重層)に挿入されるアミノ酸配列を意味する。膜貫通ドメインを使用して、目的のタンパク質(例えば、CAR)を膜に固定することができる。膜貫通ドメインは、天然源または合成源のいずれかに由来し得る。供給源が天然である場合、ドメインは、任意の膜結合タンパク質または膜貫通タンパク質に由来し得る。本開示のCARで使用される膜貫通ドメインは、T細胞受容体のα、β、またはζ鎖、CD28、CD3ε、CD45、CD4、CD5、CD8、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137、CD154の膜貫通領域を少なくとも含むことができる。一部の実施形態では、膜貫通ドメインは、CD4、CD8α、CD28、およびCD3ζに由来する。一部の実施形態では、膜貫通ドメインは、CD8αヒンジおよび膜貫通ドメインである。
本明細書で使用される場合、「治療する」、「治療すること」、「治療」などの用語は、障害および/またはそれに関連する症状を低減もしくは緩和すること、あるいは所望の薬理学的効果および/または生理学的効果を得ることを指す。除外されないが、障害または状態を治療することは、障害、状態またはそれに関連する症状が完全に排除される必要がないことを理解されたい。一部の実施形態では、効果は治療的であり、すなわち、限定されないが、その効果は、疾患および/または疾患に起因する有害な症状を、部分的または完全に、低減、減少、抑制、軽減、緩和、(その強度を)低下、または治癒する。一部の実施形態では、効果は予防的であり、すなわち、効果は、疾患または状態の発生または再発を、保護または予防する。この目的のために、本開示の方法は、治療有効量の本明細書に記載される組成物を投与することを含む。
「ウラシルグリコシラーゼ阻害因子」または「UGI」という用語は、ウラシル除去修復系を阻害する薬剤を意味する。一実施形態では、薬剤は、タンパク質またはその断片であり、宿主のウラシルDNAグリコシラーゼに結合し、DNAからのウラシル残基の除去を防止する。一実施形態では、UGIは、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。一部の実施形態では、UGIドメインは、野生型UGIまたはその修飾バージョンを含む。一部の実施形態では、UGIドメインは、以下に記載される例示的なアミノ酸配列の断片を含む。一部の実施形態では、UGI断片は、以下に提供される例示的なUGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。一部の実施形態では、UGIは、以下に記載される例示的なUGIアミノ酸配列またはその断片に相同なアミノ酸配列を含む。一部の実施形態では、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくはUGI配列またはその一部と、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%、または100%同一である。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 ウラシルDNAグリコシラーゼ阻害因子
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML。「ベクター」という用語は、核酸配列を細胞に導入し、形質転換細胞もたらす手段を指す。ベクターとしては、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが挙げられる。「発現ベクター」は、レシピエント細胞において発現されるヌクレオチド配列を含む核酸配列である。発現ベクターは、導入配列(例えば、開始、停止、エンハンサー、プロモーター、および分泌配列)の発現を促進(promote)および/または促進(facilitate)するための追加の核酸配列を含んでもよい。
「T細胞受容体ζ鎖関連プロテインキナーゼ70(ZAP70)ポリペプチド」とは、NCBI受託番号AAH53878.1と少なくとも約85%のアミノ酸配列同一性を有し、キナーゼ活性を有するタンパク質を意味する。例示的なアミノ酸配列を以下に提供する。
>AAH53878.1 ζ鎖(TCR)関連プロテインキナーゼ70kDa[Homo sapiens]
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREEAERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA
「T細胞受容体ζ鎖関連プロテインキナーゼ70(ZAP70)ポリヌクレオチド」とは、ZAP70ポリペプチドをコードする核酸を意味する。ZAP70遺伝子は、T細胞の発生およびリンパ球の活性化に関与するチロシンキナーゼをコードする。機能的なZAP10の不在は、CD8+T細胞の欠如を特徴とする、重度の複合免疫不全をもたらし得る。例示的なZAP70核酸配列を以下に提供する。
>BC053878.1 Homo sapiens ζ鎖(TCR)関連プロテインキナーゼ70kDa、mRNA(cDNAクローン MGC:61743 IMAGE:5757161)、完全長CDS
GCTTGCCGGAGCTCAGCAGACACCAGGCCTTCCGGGCAGGCCTGGCCCACCGTGGGCCTCAGAGCTGCTGCTGGGGCATTCAGAACCGGCTCTCCATTGGCATTGGGACCAGAGACCCCGCAAGTGGCCTGTTTGCCTGGACATCCACCTGTACGTCCCCAGGTTTCGGGAGGCCCAGGGGCGATGCCAGACCCCGCGGCGCACCTGCCCTTCTTCTACGGCAGCATCTCGCGTGCCGAGGCCGAGGAGCACCTGAAGCTGGCGGGCATGGCGGACGGGCTCTTCCTGCTGCGCCAGTGCCTGCGCTCGCTGGGCGGCTATGTGCTGTCGCTCGTGCACGATGTGCGCTTCCACCACTTTCCCATCGAGCGCCAGCTCAACGGCACCTACGCCATTGCCGGCGGCAAAGCGCACTGTGGACCGGCAGAGCTCTGCGAGTTCTACTCGCGCGACCCCGACGGGCTGCCCTGCAACCTGCGCAAGCCGTGCAACCGGCCGTCGGGCCTCGAGCCGCAGCCGGGGGTCTTCGACTGCCTGCGAGACGCCATGGTGCGTGACTACGTGCGCCAGACGTGGAAGCTGGAGGGCGAGGCCCTGGAGCAGGCCATCATCAGCCAGGCCCCGCAGGTGGAGAAGCTCATTGCTACGACGGCCCACGAGCGGATGCCCTGGTACCACAGCAGCCTGACGCGTGAGGAGGCCGAGCGCAAACTTTACTCTGGGGCGCAGACCGACGGCAAGTTCCTGCTGAGGCCGCGGAAGGAGCAGGGCACATACGCCCTGTCCCTCATCTATGGGAAGACGGTGTACCACTACCTCATCAGCCAAGACAAGGCGGGCAAGTACTGCATTCCCGAGGGCACCAAGTTTGACACGCTCTGGCAGCTGGTGGAGTATCTGAAGCTGAAGGCGGACGGGCTCATCTACTGCCTGAAGGAGGCCTGCCCCAACAGCAGTGCCAGCAACGCCTCAGGGGCTGCTGCTCCCACACTCCCAGCCCACCCATCCACGTTGACTCATCCTCAGAGACGAATCGACACCCTCAACTCAGATGGATACACCCCTGAGCCAGCACGCATAACGTCCCCAGACAAACCGCGGCCGATGCCCATGGACACGAGCGTGTATGAGAGCCCCTACAGCGACCCAGAGGAGCTCAAGGACAAGAAGCTCTTCCTGAAGCGCGATAACCTCCTCATAGCTGACATTGAACTTGGCTGCGGCAACTTTGGCTCAGTGCGCCAGGGCGTGTACCGCATGCGCAAGAAGCAGATCGACGTGGCCATCAAGGTGCTGAAGCAGGGCACGGAGAAGGCAGACACGGAAGAGATGATGCGCGAGGCGCAGATCATGCACCAGCTGGACAACCCCTACATCGTGCGGCTCATTGGCGTCTGCCAGGCCGAGGCCCTCATGCTGGTCATGGAGATGGCTGGGGGCGGGCCGCTGCACAAGTTCCTGGTCGGCAAGAGGGAGGAGATCCCTGTGAGCAATGTGGCCGAGCTGCTGCACCAGGTGTCCATGGGGATGAAGTACCTGGAGGAGAAGAACTTTGTGCACCGTGACCTGGCGGCCCGCAACGTCCTGCTGGTTAACCGGCACTACGCCAAGATCAGCGACTTTGGCCTCTCCAAAGCACTGGGTGCCGACGACAGCTACTACACTGCCCGCTCAGCAGGGAAGTGGCCGCTCAAGTGGTACGCACCCGAATGCATCAACTTCCGCAAGTTCTCCAGCCGCAGCGATGTCTGGAGCTATGGGGTCACCATGTGGGAGGCCTTGTCCTACGGCCAGAAGCCCTACAAGAAGATGAAAGGGCCGGAGGTCATGGCCTTCATCGAGCAGGGCAAGCGGATGGAATGCCCACCAGAGTGTCCACCCGAACTGTACGCACTCATGAGTGACTGCTGGATCTACAAGTGGGAGGATCGCCCCGACTTCCTGACCGTGGAGCAGCGCATGCGAGCCTGTTACTACAGCCTGGCCAGCAAGGTGGAAGGGCCCCCAGGCAGCACACAGAAGGCTGAGGCTGCCTGTGCCTGAGCTCCCGCTGCCCAGGGGAGCCCTCCACACCGGCTCTTCCCCACCCTCAGCCCCACCCCAGGTCCTGCAGTCTGGCTGAGCCCTGCTTGGTTGTCTCCACACACAGCTGGGCTGTGGTAGGGGGTGTCTCAGGCCACACCGGCCTTGCATTGCCTGCCTGGCCCCCTGTCCTCTCTGGCTGGGGAGCAGGGAGGTCCGGGAGGGTGCGGCTGTGCAGCCTGTCCTGGGCTGGTGGCTCCCGGAGGGCCCTGAGCTGAGGGCATTGCTTACACGGATGCCTTCCCCTGGGCCCTGACATTGGAGCCTGGGCATCCTCAGGTGGTCAGGCGTAGATCACCAGAATAAACCCAGCTTCCCTCTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
本明細書における変数の任意の定義における化学基のリストの記載は、任意の単一の基として、または列挙された基の組み合わせとして、その変数の定義を含む。本明細書における変数または態様に関する実施形態の記載は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。
本明細書に提供される任意の組成物または方法は、本明細書に提供される1つ以上の任意の他の組成物および方法と組み合わせることができる。
DNA編集は、遺伝子レベルで病原性変異を修正することによって、疾患状態を修飾するための実行可能な手段として浮上してきている。最近まで、すべてのDNA編集プラットフォームは、特定のゲノム部位でDNA二本鎖切断(DSB)を誘導し、内因性DNA修復経路に依存して、半確率的な様式で生成物の成果を決定することによって機能しており、結果として、遺伝子産物の複雑な集団がもたらされる。正確なユーザ定義の修復の成果は、相同組換え修復(HDR)経路を通して達成することができるが、いくつかの課題により、治療に関連する細胞型において、HDRを使用した高効率の修復が妨げられている。実際には、この経路は、競合するエラーが起こりやすい非相同末端結合経路と比較して非効率的である。さらに、HDRは、細胞周期のG1期およびS期に厳しく制限され、有糸分裂後の細胞におけるDSBの正確な修復を妨げる。その結果、ゲノム配列を、ユーザ定義のプログラマブルな様式で、これらの集団において高い効率で改変することが困難または不可能であることが証明されている。
参照による援用
本明細書で言及されるすべての刊行物、特許、および特許出願は、あたかも各個々の刊行物、特許、または特許出願が参照により援用されることが具体的かつ個別に示されるのと同じ程度に、参照により本明細書に援用される。
本発明の新規の特徴は、添付の特許請求の範囲に詳細に述べられている。本発明の原理が利用される例示的な実施形態を記載する以下の詳細な説明および添付の図面を参照することにより、本発明の特徴および利点のより良好な理解が得られるであろう。
図1A~1Bは、T細胞の機能に影響を与える3つのタンパク質の図である。図1Aは、移植片対宿主病における重要な成分であるTRACタンパク質の図である。図1Bは、宿主のCD8+T細胞によって認識され得る有核細胞上に存在するMHCクラス1抗原提示複合体の成分であるB2Mタンパク質の図である。図1Cは、PDCD1遺伝子の発現につながるT細胞シグナル伝達の図であり、結果として生じるPD-1タンパク質は、T細胞シグナル伝達を阻害するように作用する。
塩基編集後、標的遺伝子の発現がノックダウンされた細胞の割合のグラフである。「EP」は、エレクトロポレーションを示す。
非形質導入細胞、またはBE4塩基エディターシステムもしくはCas9ヌクレアーゼで形質導入された細胞における、観察された種類の遺伝子修飾の割合のグラフである。
BE4およびBE4をスプライス部位アクセプター(SA)もしくはドナー(SD)に導くかまたは終止(STOP)コドンを生成するsgRNAで形質導入された細胞における、フローサイトメトリー(FC)により決定される標的タンパク質の発現が陰性である細胞の割合によって測定された標的ヌクレオチド修飾の割合を示すグラフである。対照細胞は、モック(mock)でエレクトロポレーション(EP)された。
スプライス部位アクセプター(SA)、スプライスドナー(SD)を破壊するか、または終止コドンを生成するBE4システムの図である。
標的遺伝子を破壊するために用いられるsgRNAのオフターゲット結合部位をまとめたチャートである。
低減されたタンパク質発現を示すBE4またはCas9が編集された細胞のパーセンテージのフローサイトメトリー(FC)データを要約したグラフである。細胞は、B2MまたはCD3のいずれかにゲーティングされ、後者はTRAC発現のためのプロキシである。
図8Aは未編集対照細胞のFACSデータの散布図である。図8BはB2M、TRAC、およびPD1遺伝子座で編集された細胞のFACSデータの散布図である。
CAR-T免疫療法に悪影響を及ぼし得る特定の遺伝子を修飾するための、本明細書に記載の塩基編集技術の有効性を示すグラフである。
遺伝子修飾および転座を検出および定量するためのドロップレットデジタルPCR(ddPCR)のプロトコルを示す図である。
BE4システムまたはCas9システムのいずれかを使用して編集された細胞の次世代配列決定(NGS)分析またはddPCRから生成されたデータを示す2つのグラフを提示する。
Cbl-bがT細胞の活性化を抑制する役割を示す概略図である。
スプライス部位の破壊によるCbl-bノックダウンの効率を示すグラフである。SA=スプライスアクセプター、SD=スプライスドナー、STOP=生成された終止コドン、2°のみ=二次抗体のみ、C373は、機能喪失バリアント(C373R)を指す、RL1-A::APC-A=レーザー、ICS=細胞内染色。
T細胞におけるGRIN2BおよびDNMT1遺伝子におけるCas12b媒介性インデルの速度を示すグラフである。EPは、エレクトロポレーションを表す。
bvCas12b、ならびにTRAC、GRIN2B、およびDNMT1に特異的なガイドRNAを用いたエレクトロポレーション(EP)を介して形質導入された細胞の蛍光支援細胞選別(FACS)のデータ(CD3についてゲーティングされている)を要約するグラフである。
CAR-P2A-mCherryレンチウイルスを形質導入した細胞の蛍光支援細胞選別データの散布図であり、CARの発現を実証している。
蛍光支援細胞選別データの散布図であり、ポリ(1,8-オクタンジオールクエン酸塩)(POC)レンチウイルスベクターで形質導入された細胞におけるCARの発現を示す。
BE4が、高い生成物純度で、効率的で耐久性のある遺伝子ノックアウトを生成したことを示すグラフである。
図19Aは、BE4またはspCas9による遺伝子ノックアウトに起因するタンパク質の表面発現の喪失を示す代表的なFACS分析である。図19Bは、BE4またはspCas9による遺伝子ノックアウトが、B2Mの表面発現の喪失を生じさせることを示すグラフである。
B2M、TRAC、およびPD-1標的部位の位置を示す概略図である。転座は、B2M、TRAC、およびPD-1の配列が組換えられるときに検出され得る。
多重化塩基編集が細胞増殖を有意に損なわないことを示すグラフである。
BE4が、spCas9と同様のオンターゲット編集効率および細胞表現型を有する三重編集T細胞を生成したことを示すグラフである。
三重編集CD3、B2M、PD1T細胞の生成を示すフローサイトメトリー分析を示す。
BE4およびCas9編集細胞におけるCARの発現を示すフローサイトメトリー分析を示す。
CAR-T細胞死滅または抗原陽性細胞を示すグラフである。
Cas12bおよびBE4が、T細胞における効率的な多重編集のために対にされ得ることを示すグラフである。
Cas12ヌクレアーゼおよび遺伝子座を標的とするsgRNAの存在下で、CARをコードする二本鎖DNA鋳型を細胞内に導入することによって、Cas12bが遺伝子座へのキメラ抗原受容体(CAR)の挿入を導き得ることを示すグラフである。
図28A~Bは、CAR-T細胞を操作するために、遺伝子をサイレンシングするための塩基編集アプローチを示す描写である。図28Aは、CAR-T編集のための標的を示す。図28Bは、塩基エディターを用いてサイレンシングするための2つの戦略を示す:CBEを用いて終止コドンを生成すること、およびCBEを用いてスプライス破壊を生成すること。
場合によっては、AMLにおける疾患のクローン性に対処するために必要な複数のCAR-Tを示す例示的な模式的表現である。
場合によっては、T-ALL CAR-Tの組み合わせのためのフラトリサイドを排除するために複数の編集が必要とされ得る例示的な模式的表現である。
図31A~Bは、T-ALLに対して4つの同時塩基編集を試験する実験の結果を例示する。CAR-Tは、ヌクレアーゼと比較して収率に影響を与えない。図31Aは、エレクトロポレーションなし(EPなし;暗色の円)、EPのみ(暗色の正方形)、CBEバリアント1(淡色、直立の三角形)、CBEバリアント2(淡色、逆さの三角形)、およびCas9(淡色の菱形)の四重T-ALL編集の競合における理論的収率を示す。図31Bは、エレクトロポレーション後の細胞の生存率を示す。24時間(hr)、48時間、72時間、96時間、および168時間での各セットの結果について、結果を、右から左へ、EPなし、EPのみ、CBEバリアント1、CBEバリアント2、およびCas9として示す。
BE4による90%超の四重ノックアウトを示す。エレクトロポレーションを5M細胞スケールで実施し、四重編集を単一のエレクトロポレーション(EP)ステップで実施した。rBE4を用いて、4つの標的すべてについて、90%超の編集効率が達成された。各結果グループについて、データは、左から右へ示されている:PD1、CD7、TRAC、およびCD52。
塩基編集が、細胞収率に差を生じさせないことを示す。データは、EP(円)なし、EPのみ(正方形)、rBE4(三角形)、ppBE4(逆さの三角形)、およびCas9(菱形)である。
編集されたCAR-Tが、モデル腫瘍細胞上のCD3およびCD7を標的とすることを示す。データは、UTD 1:1(円)、7CAR8 1:1(正方形)、および3CAR2 1:1(三角形)である。
T-ALL腫瘍細胞を標的とするための例示的なCD7 CAR-T細胞の概略図である。
CD7 CAR-T細胞を用いて患者を治療するための臨床プロトコルを示すフローチャートである。
図37A~37Cは、CD7 CAR-T細胞の産生を示す。図37Aは、TALL017異種解凍CD7 CAR-T細胞を産生するためのプロトコルを示すフローチャートである。図37Bは、TALL083 CD7 CAR-T細胞を産生するためのプロトコルを示すフローチャートである。図37Cは、TALL017 CAR-T細胞が解凍後に高度に活性化されていることを実証する、蛍光支援細胞選別データの散布図である。
次世代配列決定(NGS)によるTALL017およびTALL038 CD7 CAR-T細胞における全編集を示すグラフである。
図39A~39Bは、TALL017およびTALL038 CD7 CAR-T細胞におけるTCRα/β、CD7、およびCD52の解凍後24時間のタンパク質発現を示す。図39Aは、TALL017およびTALL038 CD7 CAR-T細胞の蛍光支援細胞選別データの散布図である。図39Bは、FACSを介した残留タンパク質発現を示すグラフである。
同一性パネルのゲーティングスキームを示す。
CD2+/-細胞およびCD56+/-細胞の混合物としての最終細胞産物の同一性を示すグラフである。
解凍後24時間および48時間のCD7 CAR-T細胞の発現を示すグラフである。
TALL017 CD7 CAR-T細胞と比較して、TALL038 CD7 CAR-T細胞において、解凍後のCD25の発現が低いことを示すグラフを含む。
インビトロでの特徴付けのためのCD7 CAR-Tビーズに基づく力価プロトコルを示すフローチャートである。
図45A~45Bは、TALL038 CD7 CAR-T細胞が、CD7抗原に応答して、IFNγ、TNFα、およびIL-2を放出することを示す。図45Aは、TALL038 CD7 CAR-T細胞によるIFNγの放出を示すグラフである。図45Bは、TALL038 CD7 CAR-T細胞によるTNFα、IL-10、およびIL-2の放出を示すグラフである。
腫瘍細胞のCAR指向性T細胞死滅の測定のための共培養プロトコルを示す概略図である。
図47A~47Bは、TALL038 CD7 CAR-T細胞が、TALL017 CAR T細胞と比較して、再チャレンジした場合、CCRFの増加を示すことを示す。図47Aは、一次チャレンジを示すグラフである。図47Bは、二次チャレンジを示すグラフである。
CCRF移植後10日目/CD7 CAR-T処置のー1日目の生物発光輝度データ(平均、SEM)を示すグラフである。総フラックスは、線形スケールで測定される。
図49A~49Bは、CCRF移植後19日目/CD7 CAR-T処置後8日目の生物発光輝度データ(平均、SEM)を示す。図49Aは、平均腫瘍負荷を示すグラフである。総フラックスは、線形スケールで測定される。図49Bは、平均マウス体重を示すグラフである。
図50A~50Bは、CCRF移植後38日目/CD7 CAR-T処置後27日目の生物発光輝度データ(平均、SEM)を示す。図50Aは、平均腫瘍負荷を示すグラフである。総フラックスは、線形スケールで測定される。図50Bは、平均腫瘍負荷を示すグラフである。総フラックスを、対数スケールで測定した。
図51A~51Bは、CCRF移植後38日目/CD7 CAR-T処置後27日目の生物発光輝度データ(個々のマウス)を示す。図51Aは、平均腫瘍負荷を示すグラフである。総フラックスは、線形スケールで測定される。図51Bは、平均腫瘍負荷を示すグラフである。総フラックスは、対数スケールで測定される。
図52A~52Bは、CCRF移植後38日目/CD7 CAR-T処理後27日目の生物発光輝度データ(個々のマウス)を示す。図52Aは、平均腫瘍負荷を示すグラフを含む。総フラックスは、線形スケール(上)および対数スケール(下)で測定される。図52Bは、平均腫瘍負荷を示すグラフを含む。総フラックスは、線形スケール(上)および対数スケール(下)で測定される。
CD5 gRNA候補の編集効率を示すグラフである。
BE4と組み合わせたCD5 gRNA候補(g103およびg104)のNGSによる編集効率を示すグラフである。
例示的なCD5 CAR構築物の産生を示す概略図である。
CD5 gRNA候補(g103およびg104)を使用したレンチウイルスベクター(LVV)スクリーニングからのCAR発現を示すグラフである。
ヒンジ配列に基づいてCAR LVV発現を示すグラフである。
図58A~58Dは、編集および未編集構築物を示すグラフであり、ライブイメージングの細胞死滅アッセイにおいてCD5+CCRFに対して十分に細胞傷害性である。
図59A~59Bは、CD5+CCRF-CEM白血病細胞株の存在下で、sgRNA103またはsgRNA104を使用したCD5 CAR LVV構築物によるサイトカイン(IFNγ)産生を示す。図59A(左)は、CD5 CAR LVV(LV63-69)で形質導入されたT細胞単独、またはsgRNA103を用いて編集されたCCRF細胞によるIFNγの産生を示すグラフである。図59A(右)は、CD5 CAR LVV(LV63-69)で形質導入されたT細胞単独、またはsgRNA104を使用して編集されたCCRF細胞によるIFNγの産生を示すグラフである。図59A(下)は、未編集CD5 CAR LVV(LV63-69)で形質導入されたT細胞またはCCRF細胞を使用したIFNγの産生を示すグラフである。図59B(上)は、CD5 CAR LVV(LV63-69)で形質導入された(未編集の、またはsgRNA103もしくは104を使用して編集された)T細胞単独でのIFNγの産生を示すグラフである。図59B(下)は、CD5 CAR LVV(LV63-69)で形質導入された(未編集の、またはsgRNA103もしくは104を使用して編集された)CCRF細胞のIFNγの産生を示すグラフである。
本発明は、増強された抗腫瘍活性、免疫抑制に対する耐性、および移植片対宿主反応もしくは宿主対移植片反応を誘発する低減されたリスク、またはそれらの組み合わせを有する遺伝子修飾免疫細胞を特徴とする。また、本発明は、これらの修飾免疫細胞(例えば、T細胞などの免疫エフェクター細胞)の産生および使用するための方法を特徴とする。
一実施形態では、移植片対宿主病(GVHD)を有するか、またはそれを発症する傾向がある対象に、機能的なTRACを欠くか、またはそのレベルが低下しているCAR-T細胞が投与される。一実施形態では、宿主対移植片病(HVGD)を有するか、またはそれを発症する傾向がある対象に、機能的なβ2マイクログロブリン(B2M)を欠くか、またはそのレベルが低下しているCAR-T細胞が投与される。
キメラ抗原受容体を発現させ、かつ特定の遺伝子をノックアウトまたはノックダウンして、それらの発現の免疫細胞機能に及ぼし得る負の影響を軽減するための免疫エフェクター細胞の修飾は、本明細書に記載されるシチジンデアミナーゼまたはアデノシンデアミナーゼを含む塩基エディターシステムを使用して達成される。
自己由来、患者由来のキメラ抗原受容体-T細胞(CAR-T)療法は、いくつかの血液がんの治療において顕著な有効性を示している。これらの製品は、患者に著しい臨床的利益をもたらしたが、個別化された療法を生み出す必要性は、製造上の大きな課題と経済的負担をもたらす。同種CAR-T療法は、これらの課題に対する潜在的な解決策として開発され、単一の健康なドナーに由来する細胞を用いて多くの患者を治療しながら、自己産物と同様の臨床有効性のプロファイルを有し、それによって、商品のコストおよびロット間の変動性を実質的に低減した。
ほとんどの第1世代の同種CAR-Tは、ヌクレアーゼを使用して、標的T細胞集団に2つ以上の標的ゲノムDNA二本鎖切断(DSB)を導入し、エラーが起こりやすいDNA修復に依存して、標的遺伝子を半確率的にノックアウトする変異を生成する。このようなヌクレアーゼベースの遺伝子ノックアウト戦略は、移植片対宿主病およびCAR-Tの宿主拒絶のリスクを低減することを目的とする。しかしながら、複数のDSBの同時誘導により、均衡転座および不均衡転座などの大規模なゲノム再編成、ならびに逆位および大きな欠失を含む比較的多量の局所的再編成を含む最終細胞産物がもたらされる。さらに、誘導DSBによって作製される同時遺伝子修飾の数が増加すると、処理された細胞集団において、かなりの遺伝毒性が観察される。これは、各製造工程からの細胞増殖の可能性を著しく低下させ、それによって、健康なドナー当たりの治療可能な患者数を減少させる可能性がある。
塩基エディター(base editor、BE)は、DSBを生成することなく、標的ゲノムDNAの高効率でユーザ定義の修飾を可能にする新しい遺伝子編集試薬のクラスである。ここで、同種CAR-T細胞を産生する代替的な手段は、検出可能なゲノム再編成を低減または排除し、同時に細胞増殖も改善する塩基編集技術を使用することによって提案される。本明細書に示されるように、ヌクレアーゼのみの編集戦略とは対照的に、塩基編集による1つ以上(例えば、1、2、3、4、5、6、7、8、夜、10個、またはそれ以上)の遺伝子座の同時修飾は、検出可能な転座事象を伴わずに、非常に効率的な遺伝子ノックアウトを生成する。
一部の実施形態では、少なくとも1つ以上の遺伝子またはその調節エレメントは、本明細書に提供される塩基編集組成物および方法を用いて、免疫細胞内で修飾される。一部の実施形態では、少なくとも1つ以上の遺伝子またはその調節エレメントは、ACAT1、ACLY、ADORA2A、AXL、B2M、BATF、BCL2L11、BTLA、CAMK2D、cAMP、CASP8、CBLB、CCR5、CD2、CD3D、CD3E、CD3G、CD4、CD5、CD7、CD8A、CD33、CD38、CD52、CD70、CD82、CD86、CD96、CD123、CD160、CD244、CD276、CDK8、CDKN1B、Chi3l1、CIITA、CISH、CSF2CSK、CTLA-4、CUL3、Cyp11a1、DCK、DGKA、DGKZ、DHX37、ELOB(TCEB2)、ENTPD1(CD39)、FADD、FAS、GATA3、IL6、IL6R、IL10、IL10RA、IRF4、IRF8、JUNB、Lag3、、LAIR-1(CD305)、LDHA、LIF、LYN、MAP4K4、MAPK14、MCJ、MEF2D、MGAT5、NR4A1、NR4A2、NR4A3、NT5E(CD73)、ODC1、OTULINL(FAM105A)、PAG1、PDCD1、PDIA3、PHD1(EGLN2)、PHD2(EGLN1)、PHD3(EGLN3)、PIK3CD、PIKFYVE、PPARa、PPARd、PRDMI1、PRKACA、PTEN、PTPN2、PTPN6、PTPN11、PVRIG(CD112R)、RASA2、RFXANK、SELPG/PSGL1、SIGLEC15、SLA、SLAMF7、SOCS1、Spry1、Spry2、STK4、SUV39、H1TET2、TGFbRII、TIGIT、Tim-3、TMEM222、TNFAIP3、TNFRSF8(CD30)、TNFRSF10B、TOX、TOX2、、TRAC、TRBC1、TRBC2、UBASH3A、VHL、VISTA、XBP1、YAP1、およびZC3H12Aから選択される。一部の実施形態では、少なくとも1つ以上の遺伝子またはその調節エレメントは、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される。一部の実施形態では、修飾免疫細胞は、CD5と、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される少なくとも1つ以上の遺伝子またはその調節エレメントと、における修飾を含む。一部の実施形態では、修飾免疫細胞は、CD7と、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される少なくとも1つ以上の遺伝子またはその調節エレメントと、における修飾を含む。一部の実施形態では、修飾免疫細胞は、CD33と、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される少なくとも1つ以上の遺伝子またはその調節エレメントと、における修飾を含む。一部の実施形態では、修飾免疫細胞は、CD3と、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される少なくとも1つ以上の遺伝子またはその調節エレメントと、における修飾を含む。一部の実施形態では、修飾免疫細胞は、CD123と、TRAC、LAG-3、FAS、CD52、TRBC1、TRBC2、B2M、およびCIITAおよびPD-1から選択される少なくとも1つ以上の遺伝子またはその調節エレメントと、における修飾を含む。遺伝子の多重編集(multiplex editing)は、改善された治療特性を有するCAR-T細胞療法の生成において有用であり得る。この方法は、多重編集T細胞産物の既知の制約に対処し、次世代の精密な細胞ベースの療法に向けた有望な進展である。
一態様では、本明細書において、ユニバーサルCAR-T細胞が提供される。一部の実施形態では、本明細書に記載のCAR-T細胞は、同種細胞である。一部の実施形態では、ユニバーサルCAR-T細胞は、同種T細胞であり、所望のCARを発現するために使用することができ、ドナーおよびレシピエントの免疫原的適合性に関係なく、普遍的に適用可能であり得る。同種免疫細胞は、1つ以上のドナーに由来し得る。特定の実施形態では、同種免疫細胞は、単一のヒトドナーに由来する。例えば、同種T細胞は、単一の健康なヒトドナーのPBMCに由来し得る。特定の実施形態では、同種免疫細胞は、複数のヒトドナーに由来する。一部の実施形態では、ユニバーサルCAR-T細胞は、本明細書に記載のように、複数の遺伝子座(例えば、3、4、5、6、7、8、9、10個、またはそれ以上の遺伝子座)で同時編集を導入するために、遺伝子修飾を使用することによって生成され得る。本明細書に記載される修飾または同時修飾は、塩基エディターによって生成される、塩基編集などの遺伝子編集であってもよい。塩基エディターは、C塩基エディターまたはA塩基エディターであり得る。本明細書で論じられるように、遺伝子が発現されないように、遺伝子破壊を達成するために塩基編集を使用することができる。遺伝子発現の低減を達成するために、塩基編集による修飾を使用することができる。一部の実施形態では、編集された遺伝子が構造的または機能的に実用可能なタンパク質産物を生成しないように、遺伝子修飾を導入するために塩基エディターを使用することができる。一部の実施形態では、本明細書に記載される同時修飾などの修飾は、遺伝子産物の発現または機能性が任意の方法で変化するように、塩基編集などの遺伝子編集を含んでもよい。例えば、遺伝子産物の発現は、ベースライン発現レベルと比較して、増強または上方制御され得る。一部の実施形態では、遺伝子産物の活性または機能性は、塩基編集、または協調して作用する複数の塩基編集事象の結果として上方制御され得る。
一部の実施形態では、ユニバーサルCAR-T細胞の生成は、緊急使用のために生成することが困難な場合がある自己T細胞(CAR-T)よりも有利であり得る。同種アプローチは、CARを発現し、医療緊急時に移植のための所望の細胞産物を最終的に達成するための操作された自己T細胞の不確実性に関連するいくつかの状況に対して、自己細胞調製よりも好ましい。しかしながら、同種T細胞、または「既製の」T細胞の場合、CAR-T細胞(HVGD)に対する宿主の反応性ならびに同種T細胞の宿主細胞(GVHD)に対する潜在的な敵対性を慎重に協議することが重要である。このシナリオを考えると、塩基編集をうまく使用して、複数の同時遺伝子編集事象を生成することができ、その結果、(a)抗原の発現を低減もしくは下方制御して、フラトリサイド耐性の免疫細胞を生成することが可能であり、(b)内因性T細胞受容体、例えば、TCRα鎖(TRACの塩基編集を介するような)もしくはTCRβ鎖(TRBC1/TRBC2の塩基編集を介するような)を欠いているか、または少量発現するプラットフォーム細胞型を生成することが可能であり、かつ/あるいは(c)宿主組織系に適合しない可能性がある抗原の発現を低減または下方制御すること(その逆も同様)が可能である。
一部の実施形態では、本明細書に記載の方法を使用して、CAR-Tを発現する自己T細胞を生成することができる。一部の実施形態では、複数の塩基編集事象は、単一のエレクトロポレーション事象で達成することができ、それによって、エレクトロポレーション事象に付随する毒性が低減される。細胞に外因性遺伝物質を組み込むための任意の既知の方法を使用して、エレクトロポレーションを置き換えることができ、かかる方法は、当該技術分野で既知であり、それゆえ、本明細書に記載の方法のいずれかにおける使用が企図される。
一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞の悪性腫瘍)を有するか、または発症する傾向がある対象は、CD2を欠くかまたはそのレベルが低減され、かつCD2共刺激ドメインを含むCD2キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)を投与される。一部の実施形態では、対象に投与されるCD2修飾免疫細胞は、本明細書に提供される塩基編集組成物および方法を用いて、1つ以上の遺伝子または調節エレメント(例えば、CD52、TRAC、PD-1)がさらに修飾される。
本明細書に示されるように、CAR挿入と組み合わせた塩基編集は、ゲノム再編成を最小化しながらフラトリサイド耐性の同種T細胞を生成するための有用な戦略である。また、遺伝子の多重編集は、改善された治療特性を有するCAR-T細胞療法の生成において有用であり得る。この方法は、CAR-T療法の既知の制約に対処し、次世代の精密な細胞ベースの療法に向けた有望な進展である。
ある実験では、塩基エディターBE4は、T細胞における3つの細胞表面標的(TRAC、B2M、およびPD-1)の高効率な多重塩基編集を実証し、単一のエレクトロポレーションで、遺伝子発現をそれぞれ95%、95%、および88%ノックアウトして、B2MおよびCD3のタンパク質発現が低下した細胞の割合が高い細胞集団を生成した。これらの遺伝子の各々を編集することは、改善された治療特性を有するCAR-T細胞療法の生成において有用であり得る。遺伝子の各々を、二本鎖切断を生成することなく、単一の標的塩基改変(CからT)によってサイレンシングした。結果として、BE4で処理された細胞はまた、測定可能な転座(大規模なゲノム再編成)も示さなかった。しかし、ヌクレアーゼによる同じ3つの編集を受けた細胞は、検出可能なゲノム再編成を示した。
したがって、TRAC遺伝子のヌクレアーゼベースのノックアウトを、2つの追加の遺伝子の同時BE媒介性ノックアウトとカップリングすることで、ゲノム再編成を最小化しながら均一な同種T細胞集団が得られ、TRAC遺伝子座におけるCAR導入遺伝子の標的化挿入が可能となる。まとめると、これは、塩基編集単独、または単一ヌクレアーゼノックアウトおよびCAR挿入と組み合わせが、ヌクレアーゼ単独のアプローチと比較して、ゲノム再編成を最小化しながら同種T細胞を生成するための有用な戦略であることを示す。この方法は、多重編集T細胞産物の既知の制約に対処し、次世代の精密な細胞ベースの療法に向けた有望な進展である。
キメラ抗原受容体およびCAR-T細胞
本発明は、本明細書に記載の核酸塩基エディターを使用して修飾されたキメラ抗原受容体(CAR)を発現する免疫細胞を提供する。キメラ抗原受容体を発現するための免疫細胞の修飾は、免疫細胞の免疫反応活性を増強することができる。ここで、キメラ抗原受容体は、抗原上のエピトープに対する親和性を有し、抗原は、生物の変化した適合性に関連付けられる。例えば、キメラ抗原受容体は、腫瘍細胞で発現されたタンパク質上のエピトープに対する親和性を有することができる。CAR-T細胞は、主要組織適合複合体(MHC)とは独立して作用することができるため、活性化されたCAR-T細胞は、抗原を発現する腫瘍細胞を死滅させることができる。CAR-T細胞の直接作用は、免疫細胞に対する抗原のMHC提示に応答して進化した腫瘍細胞の防御機構を回避する。
一部の実施形態では、本発明は、免疫エフェクター細胞を提供し、それは、自己免疫応答に関与するB細胞(例えば、対象自身の組織に対して生成された抗体を発現する対象のB細胞)を標的とするキメラ抗原受容体を発現する。
一部の実施形態は、自己免疫細胞免疫療法を含み、免疫細胞は、表面マーカーを発現するがん性細胞またはその他の変化した細胞を特徴とする疾患または変化した適合性を有する対象から得られる。得られた免疫細胞は、キメラ抗原受容体を発現するように遺伝子修飾され、特定の抗原に対して効果的に再誘導される。したがって、一部の実施形態では、免疫細胞は、CAR-T免疫療法を必要とする対象から得られる。一部の実施形態では、これらの自己免疫細胞は、対象から得られた直後に培養および修飾される。他の実施形態では、自己細胞を得て、次いで、将来使用するために保存される。この慣行は、将来的に免疫細胞数を減少させる並列治療を受けている可能性がある個体に推奨され得る。同種免疫細胞免疫療法において、免疫細胞は、治療を受ける対象以外のドナーから得ることができる。一部の実施形態では、免疫細胞は、健康な対象またはドナーから得られ、キメラ抗原受容体を発現するように遺伝子修飾され、特定の抗原に対して効果的に再誘導される。免疫細胞は、キメラ抗原受容体を発現するように修飾された後、腫瘍(例えば、白血病)を治療するために対象に投与される。一部の実施形態では、キメラ抗原受容体を発現するように修飾される免疫細胞は、免疫細胞の既存のストック培養物から得ることができる。
免疫細胞および/または免疫エフェクター細胞は、当該技術分野で既知の標準的な技法を使用して、対象またはドナーから収集された試料から単離または精製され得る。例えば、免疫エフェクター細胞は、赤血球を溶解し、遠心分離で末梢単核血球を除去することによって、全血試料から単離または精製することができる。免疫エフェクター細胞は、CD25、CD3、CD4、CD8、CD28、CD45RA、またはCD45ROなどの細胞特異的マーカーに基づいて免疫エフェクター細胞を単離する選択的精製方法を使用して、さらに単離または精製され得る。一実施形態では、CD25+は、制御性T細胞を選択するためのマーカーとして使用される。一実施形態では、CD4は、T細胞を選択するためのマーカーとして使用される。一実施形態では、CD8は、T細胞を選択するためのマーカーとして使用される。一実施形態では、CD4およびCD8は、T細胞を選択するためのマーカーとして使用される。一実施形態では、CD4およびCD25は、T細胞を選択するためのマーカーとして使用される。
別の実施形態では、本発明は、TCRαβの表面発現を担うTCR定常領域(TRAC)に標的化遺伝子ノックアウトを有するT細胞を提供する。TCRαβ欠損CAR T細胞は、同種免疫療法と適合性である(Qasim et al.,Sci.Transl.Med.9,eaaj2013(2017);Valton et al.,Mol Ther.2015 Sep;23(9):1507-1518)。所望により、残留TCRαβT細胞は、GVHDのリスクを最小化するために、CliniMACS磁気ビーズ枯渇を使用して除去される。別の実施形態では、本発明は、レシピエント造血細胞で発現するマイナー組織適合抗原を認識するために、エクスビボで選択されるドナーT細胞を提供し、それによって、移植後の罹患率および死亡率の主な原因である移植片対宿主病(GVHD)のリスクを最小化する(Warren et al.,Blood 2010;115(19):3869-3878)。免疫エフェクター細胞を単離または精製するための別の技術は、フローサイトメトリーである。蛍光活性化細胞選別において、免疫エフェクター細胞マーカーに対して親和性を有する蛍光標識抗体を使用して、試料中の免疫エフェクター細胞を標識する。マーカーを発現する細胞に適したゲーティング戦略を使用して細胞を分離する。例えば、Tリンパ球は、例えば、免疫エフェクター細胞マーカーに特異的な蛍光標識抗体(例えば、CD4、CD8、CD28、CD45)および対応するゲーティング戦略を使用することによって、試料中の他の細胞から分離され得る。一実施形態では、CD45ゲーティング戦略が用いられる。一部の実施形態では、免疫エフェクター細胞に特異的な他のマーカーのゲーティング戦略が、CD45ゲーティング戦略の代わりに用いられるか、またはCD45ゲーティング戦略と組み合わせて用いられる。一実施形態では、CD4ゲーティング戦略が用いられる。一実施形態では、CD8ゲーティング戦略が用いられる。一実施形態では、CD25ゲーティング戦略が用いられる。一実施形態では、CD4およびCD8ゲーティング戦略が用いられる。一実施形態では、CD4およびCD25ゲーティング戦略が用いられる。一部の実施形態では、免疫エフェクター細胞に特異的な他のマーカーのゲーティング戦略が、CD4、CD25、および/またはCD8ゲーティング戦略の代わりに用いられるか、またはそれと組み合わせて用いられる。一部の実施形態では、図40に提供されるゲーティング戦略が用いられる。
本発明で企図される免疫エフェクター細胞は、エフェクターT細胞である。一部の実施形態では、エフェクターT細胞は、ナイーブCD8T細胞、細胞傷害性T細胞、ナチュラルキラーT(NKT)細胞、ナチュラルキラー(NK)細胞、または制御性T(Treg)細胞である。一部の実施形態では、エフェクターT細胞は、胸腺細胞、未熟Tリンパ球、成熟Tリンパ球、静止Tリンパ球、または活性化Tリンパ球である。一部の実施形態では、免疫エフェクター細胞は、CD4CD8T細胞またはCD4CD8T細胞である。一部の実施形態では、免疫エフェクター細胞は、Tヘルパー細胞である。一部の実施形態では、Tヘルパー細胞は、Tヘルパー1(Th1)、Tヘルパー2(Th2)細胞、またはCD4を発現するヘルパーT細胞(CD4+T細胞)である。一部の実施形態では、免疫エフェクター細胞は、エフェクターNK細胞である。一部の実施形態では、免疫エフェクター細胞は、T細胞の任意の他のサブセットである。修飾された免疫エフェクター細胞は、キメラ抗原受容体に加えて、外因性サイトカイン、異なるキメラ受容体、または免疫エフェクター細胞のシグナル伝達または機能を増強する任意の他の薬剤を発現し得る。例えば、キメラ抗原受容体とサイトカインの共発現は、標的細胞を溶解するCAR-T細胞の能力を増強することができる。
本発明で企図されるキメラ抗原受容体は、細胞外結合ドメイン、膜貫通ドメイン、および細胞内ドメインを含む。抗原の細胞外結合ドメインへの結合は、CAR-T細胞を活性化し、CAR-T細胞の増殖、サイトカインの産生、および抗原発現細胞の死につながる他のプロセスを含むエフェクター応答を生成し得る。本発明の一部の実施形態では、キメラ抗原受容体は、リンカーをさらに含む。一部の実施形態では、リンカーは、(GGGGS)リンカーである。一部の実施形態では、リンカーは、(GGGGS)リンカーである。一部の実施形態では、本発明のCARは、リーダーペプチド配列(例えば、抗原結合ドメインのN末端)を含む。例示的なリーダーペプチドのアミノ酸配列は、METDTLLLWVLLLWVPGSTGである。
本明細書で企図されるキメラ抗原受容体の細胞外結合ドメインは、特定の抗原に対する親和性を有する抗体またはその抗原結合断片のアミノ酸配列を含む。様々な実施形態では、CARは、5T4に特異的に結合する。例示的な抗5T4CARとしては、限定されないが、CART-5T4(Oxford BioMedica plc)およびUCART-5T4(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、αフェトプロテインに特異的に結合する。例示的な抗αフェトプロテインCARとしては、限定されないが、ET-1402(Eureka Therapeutics Inc)が挙げられる。
様々な実施形態では、CARは、Axlに特異的に結合する。例示的な抗Axl CARとしては、限定されないが、CCT-301-38(F1 Oncology Inc.)が挙げられる。
様々な実施形態では、CARは、B7H6に特異的に結合する。例示的な抗B7H6 CARとしては、限定されないが、CYAD-04(Celyad SA)が挙げられる。
様々な実施形態では、CARは、BCMAに特異的に結合する。例示的な抗BCMA CARとしては、限定されないが、ACTR-087+SEA-BCMA(Seattle Genetics Inc)、ALLO-715(Cellectis SA)、ARI-0002(Institut d’Investigacions Biomediques August Pi I Sunyer)、bb-2121(bluebird bio Inc)、bb-21217(bluebird bio Inc)、CART-BCMA(University of Pennsylvania)、CT-053(Carsgen Therapeutics Ltd)、Descartes-08(Cartesian Therapeutics)、FCARH-143(Juno Therapeutics Inc)、ICTCAR-032(Innovative Cellular Therapeutics Co Ltd)、IM21 CART(Beijing Immunochina Medical Science&Technology Co Ltd)、JCARH-125(Memorial Sloan-Kettering Cancer Center)、KITE-585(Kite Pharma Inc)、LCAR-B38M(Nanjing Legend Biotech Co Ltd)、LCAR-B4822M(Nanjing Legend Biotech Co Ltd)、MCARH-171(Memorial Sloan-Kettering Cancer Center)、P-BCMA-101(Poseida Therapeutics Inc)、P-BCMA-ALLO1(Poseida Therapeutics Inc)、spCART-269(Shanghai Unicar-Therapy Bio-medicine Technology Co Ltd)、およびBCMA02/bb2121(bluebird bio Inc)が挙げられる。BCMA02/bb2121 CARのポリペプチド配列を以下に提供する:
MALPVTALLLPLALLLHAARPDIVLTQSPPSLAMSLGKRATISCRASESVTILGSHLIHWYQQKPGQPPTLLIQLASNVQTGVPARFSGSGSRTDFTLTIDPVEEDDVAVYYCLQSRTIPRTFGGGTKLEIKGSTSGSGKPGSGEGSTKGQIQLVQSGPELKKPGETVKISCKASGYTFTDYSINWVKRAPGKGLKWMGWINTETREPAYAYDFRGRFAFSLETSASTAYLQINNLKYEDTATYFCALDYSYAMDYWGQGTSVTVSSAAATTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR
様々な実施形態では、CARは、CCK2Rに特異的に結合する。例示的な抗CCK2R CARとしては、限定されないが、抗CCK2R CAR-Tアダプター分子(CAM)+抗FITC CAR T細胞療法(がん)、Endocyte/Purdue(Purdue University)が挙げられる。
様々な実施形態では、CARは、CD抗原に特異的に結合する。例示的な抗CD抗原CARとしては、限定されないが、VM-802(ViroMed Co Ltd)が挙げられる。
様々な実施形態では、CARは、CD123に特異的に結合する。例示的な抗CD123 CARとしては、限定されないが、MB-102(Fortress Biotech Inc)、RNA CART123(University of Pennsylvania)、SFG-iMC-CD123.zeta(Bellicum Pharmaceuticals Inc)、およびUCART-123(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、CD133に特異的に結合する。例示的な抗CD133 CARとしては、限定されないが、KD-030(Nanjing Kaedi Biotech Inc.)が挙げられる。
様々な実施形態では、CARは、CD138に特異的に結合する。例示的な抗CD138 CARとしては、限定されないが、ATLCAR.CD138(UNC Lineberger Comprehensive Cancer Center)およびCART-138(Chinese PLA General Hospital)が挙げられる。
様々な実施形態では、CARは、CD171に特異的に結合する。例示的な抗CD171 CARとしては、限定されないが、JCAR-023(Juno Therapeutics Inc)が挙げられる。
様々な実施形態では、CARは、CD19に特異的に結合する。例示的な抗CD19 CARとしては、限定されないが、1928z-41BBL(Memorial Sloan-Kettering Cancer Center)、1928z-E27(Memorial Sloan-Kettering Cancer Center)、19-28z-T2(Guangzhou Institutes of Biomedicine and Health)、4G7-CARD(University College London)、4SCAR19(Shenzhen Geno-Immune Medical Institute)、ALLO-501(Pfizer Inc)、ATA-190(QIMR Berghofer Medical Research Institute)、AUTO-1(University College London)、AVA-008(Avacta Ltd)、axicabtagene ciloleucel(Kite Pharma Inc)、BG-T19(Guangzhou Bio-gene Technology Co Ltd)、BinD-19(Shenzhen BinDeBio Ltd.)、BPX-401(Bellicum Pharmaceuticals Inc)、CAR19h28TM41BBz(Westmead Institute for Medical Research)、C-CAR-011(Chinese PLA General Hospital)、CD19CART(Innovative Cellular Therapeutics Co Ltd)、CIK-CAR.CD19(Formula Pharmaceuticals Inc)、CLIC-1901(Ottawa Hospital Research Institute)、CSG-CD19(Carsgen Therapeutics Ltd)、CTL-119(University of Pennsylvania)、CTX-101(CRISPR Therapeutics AG)、DSCAR-01(Shanghai Hrain Biotechnology)、ET-190(Eureka Therapeutics Inc)、FT-819(Memorial Sloan-Kettering Cancer Center)、ICAR-19(Immune Cell Therapy Inc)、IM19 CAR-T(Beijing Immunochina Medical Science&Technology Co Ltd)、JCAR-014(Juno Therapeutics Inc)、JWCAR-029(MingJu Therapeutics(Shanghai)Co.,Ltd)、KD-C-19(Nanjing Kaedi Biotech Inc)、LinCART19(iCell Gene Therapeutics)、lisocabtagene maraleucel(Juno Therapeutics Inc)、MatchCART(Shanghai Hrain Biotechnology)、MB-CART19.1(Shanghai Children’s Medical Center)、PBCAR-0191(Precision BioSciences Inc)、PCAR-019(PersonGen Biomedicine(Suzhou)Co Ltd)、pCAR-19B(Chongqing Precision Biotech Co Ltd)、PZ-01(Pinze Lifetechnology Co Ltd)、RB-1916(Refuge Biotechnologies Inc)、SKLB-083019(Chengdu Yinhe Biomedical Co Ltd)、spCART-19(Shanghai Unicar-Therapy Bio-medicine Technology Co Ltd)、TBI-1501(Takara Bio Inc)、TC-110(TCR2 Therapeutics Inc)、TI-1007(Timmune Biotech Inc)、tisagenlecleucel(Abramson Cancer Center of the University of Pennsylvania)、U-CART(Shanghai Bioray Laboratory Inc)、UCART-19(Wugen Inc)、UCART-19(Cellectis SA)、vadacabtagene leraleucel(Memorial Sloan-Kettering Cancer Center)、XLCART-001(Nanjing Medical University)、およびyinnuokati-19(Shenzhen Innovation Immunotechnology Co Ltd)が挙げられる。
様々な実施形態では、CARは、CD2に特異的に結合する。例示的な抗CD2 CARとしては、限定されないが、UCART-2(Wugen Inc)が挙げられる。
様々な実施形態では、CARは、CD20に特異的に結合する。例示的な抗CD20 CARとしては、限定されないが、ACTR-087(National University of Singapore)、ACTR-707(Unum Therapeutics Inc)、CBM-C20.1(Chinese PLA General Hospital)、MB-106(Fred Hutchinson Cancer Research Center)、およびMB-CART20.1(Miltenyi Biotec GmbH)が挙げられる。
様々な実施形態では、CARは、CD22に特異的に結合する。例示的な抗CD22 CARとしては、限定されないが、抗CD22 CAR T-cell therapy(B-cell acute lymphoblastic leukemia)、University of Pennsylvania(University of Pennsylvania)、CD22-CART(Shanghai Unicar-Therapy Bio-medicine Technology Co Ltd)、JCAR-018(Opus Bio Inc)、MendCART(Shanghai Hrain Biotechnology)、およびUCART-22(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、CD30に特異的に結合する。例示的な抗CD30 CARとしては、限定されないが、ATLCAR.CD30(UNC Lineberger Comprehensive Cancer Center)、CBM-C30.1(Chinese PLA General Hospital)、およびHu30-CD28zeta(National Cancer Institute)が挙げられる。
様々な実施形態では、CARは、CD33に特異的に結合する。例示的な抗CD33 CARとしては、限定されないが、抗CD33 CAR gamma delta T-cell therapy(acute myeloid leukemia)、TC BioPharm/University College London(University College London)、CAR33VH(Opus Bio Inc)、CART-33(Chinese PLA General Hospital)、CIK-CAR.CD33(Formula Pharmaceuticals Inc)、UCART-33(Cellectis SA)、およびVOR-33(Columbia University)が挙げられる。
様々な実施形態では、CARは、CD38に特異的に結合する。例示的な抗CD38 CARとしては、限定されないが、UCART-38(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、CD38A2に特異的に結合する。例示的な抗CD38A2 CARとしては、限定されないが、T-007(TNK Therapeutics Inc)が挙げられる。
様々な実施形態では、CARは、CD4に特異的に結合する。例示的な抗CD4 CARとしては、限定されないが、CD4CAR(iCell Gene Therapeutics)が挙げられる。
様々な実施形態では、CARは、CD44に特異的に結合する。例示的な抗CD44 CARとしては、限定されないが、CAR-CD44v6(Istituto Scientifico H San Raffaele)が挙げられる。
様々な実施形態では、CARは、CD5に特異的に結合する。例示的な抗CD5 CARとしては、これらに限定されないが、CD5CAR(iCell Gene Therapeutics)が挙げられる。例示的なCD5 CARアミノ酸配列は、以下に提供される:
>5CAR-CH3-CD28TM-CD28-CD3Z
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60

61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120

121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180

181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240

241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300

301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360

361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKFWVLVVVGGVLACYSLLVTVAFIIFWV 420

421 RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQ 480

481 LYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGE 540

541 RRRGKGHDGLYQGLSTATKDTYDALHMQALPPR 573
>5CAR-CD8aH-CD28TM-CD28-CD3Z
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60

61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120

121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180

181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240

241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300

301 AGGAVHTRGLDFACDFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPR 360

361 RPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDK 420

421 RRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTAT 480

481 KDTYDALHMQALPPR 495
>5CAR-CD28H-CD28TM-CD28-CD3Z
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60

61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120

121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180

181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240

241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAIEVMYPPPYLDNEKSNGTIIHVKGKHLCPS 300

301 PLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTR 360

361 KHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDP 420

421 EMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDA 480

481 LHMQALPPR 489
>5CAR-CH3-CD8aTM-41BB-CD3Z
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60

61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120

121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180

181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240

241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300

301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360

361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKPTTTPAPRPPTPAPTIASQPLSLRPEA 420

421 CRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMR 480

481 PVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVL 540

541 DKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLST 600

601 ATKDTYDALHMQALPPR 617
>5CAR-CD8aH-CD8aTM-41BB-CD3Z
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60

61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120

121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180

181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240

241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300

301 AGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQT 360

361 TQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRR 420

421 GRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD 480

481 TYDALHMQALPPRX 494
様々な実施形態では、CARは、CD7に特異的に結合する。例示的な抗CD7 CARとしては、限定されないが、CAR-pNK(PersonGen Biomedicine(Suzhou)Co Ltd)、およびCD7.CAR/28zeta CAR T cells(Baylor College of Medicine)、UCART7(Washington University in St Louis)が挙げられる。例示的なCD7 CARアミノ酸配列は、以下のとおりである:
>7CAR8
1 MALPVTALLLPLALLLHAARPGSDIELTQSPAIMSASLGEEITLTCSASSSVSYMHWYQQ 60
61 KSGTSPKLLIYSTSNLASGVPSRFSGSGSGTFYSLTISSVEAEDAADYYCHQWSSYTFGG 120
121 GTKLEIKRGGGGSGGGGSGGGGSQVKLQESGGGLVKPGGSLKLSCAASGFTFSSYAMSWV 180
181 RQTPEKRLEWVATISSGGSYTYYPDSVKGRFTISRDNAKNTLYLQMSSLRSEDTAMYYCA 240
241 RQDGYYPGWFANWGQGTTVTVSSAAATTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGA 300
301 VHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRK 360
361 HYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPE 420
421 MGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDAL 480
481 HMQALPPR 488
様々な実施形態では、CARは、CDH17に特異的に結合する。例示的な抗CDH17 CARとしては、限定されないが、ARB-001.T(Arbele Ltd)が挙げられる。
様々な実施形態では、CARは、CEAに特異的に結合する。例示的な抗CEA CARとしては、限定されないが、HORC-020(HumOrigin Inc)が挙げられる。
様々な実施形態では、CARは、キメラTGFβ受容体(CTBR)に特異的に結合する。例示的な抗キメラTGF-β受容体(CTBR)CARとしては、限定されないが、CAR-CTBR T細胞(bluebird bio Inc)が挙げられる。
様々な実施形態では、CARは、クローディン18.2に特異的に結合する。例示的な抗クローディン18.2 CARとしては、限定されないが、CAR-CLD18 T細胞(Carsgen Therapeutics Ltd)およびKD-022(Nanjing Kaedi Biotech Inc)が挙げられる。
様々な実施形態では、CARは、CLL1に特異的に結合する。例示的な抗CLL1 CARとしては、限定されないが、KITE-796(Kite Pharma Inc.)が挙げられる。
様々な実施形態では、CARは、DLL3に特異的に結合する。例示的な抗DLL3 CARとしては、限定されないが、AMG-119(Amgen Inc)が挙げられる。
様々な実施形態では、CARは、デュアル BCMA/TACI(APRIL)に特異的に結合する。例示的な抗デュアルBCMA/TACI(APRIL)CARとしては、限定されないが、AUTO-2(Autolus Therapeutics Limited)が挙げられる。
様々な実施形態では、CARは、デュアルCD19/CD22に特異的に結合する。例示的な抗デュアルCD19/CD22 CARとしては、限定されないが、AUTO-3(Autolus Therapeutics Limited)およびLCAR-L10D(Nanjing Legend Biotech Co Ltd)が挙げられる。
様々な実施形態では、CARは、CD19に特異的に結合する。
様々な実施形態では、CARは、デュアルCLL1/CD33に特異的に結合する。例示的な抗デュアルCLL1/CD33 CARとしては、限定されないが、ICG-136(iCell Gene Therapeutics)が挙げられる。
様々な実施形態では、CARは、デュアルEpCAM/CD3に特異的に結合する。例示的な抗デュアルEpCAM/CD3 CARとしては、限定されないが、IKT-701(Icell Kealex Therapeutics)が挙げられる。
様々な実施形態では、CARは、デュアルErbB/4abに特異的に結合する。例示的な抗デュアルErbB/4abCARとしては、限定されないが、LEU-001(King’s College London)が挙げられる。
様々な実施形態では、CARは、デュアルFAP/CD3に特異的に結合する。例示的な抗デュアルFAP/CD3 CARとしては、限定されないが、IKT-702(Icell Kealex Therapeutics)が挙げられる。
様々な実施形態では、CARは、EBVに特異的に結合する。例示的な抗EBV CARとしては、限定されないが、TT-18(Tessa Therapeutics Pte Ltd)が挙げられる。
様々な実施形態では、CARは、EGFRに特異的に結合する。例示的な抗EGFR CARとしては、限定されないが、抗EGFR CAR T細胞療法(CBLB MegaTAL、cancer)、bluebird bio(bluebird bio Inc)、CTLA-4チェックポイント阻害因子+PD-1チェックポイント阻害因子mAbsを発現する抗EGFR CAR T細胞療法(EGFR陽性進行固形腫瘍)、Shanghai Cell Therapy Research Institute(Shanghai Cell Therapy Research Institute)、CSG-EGFR(Carsgen Therapeutics Ltd)、およびEGFR-IL12-CART(Pregene(Shenzhen)Biotechnology Co Ltd)が挙げられる。
様々な実施形態では、CARは、EGFRvIIIに特異的に結合する。例示的な抗EGFRvIII CARとしては、限定されないが、KD-035(Nanjing Kaedi Biotech Inc)およびUCART-EgfrVIII(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、Flt3に特異的に結合する。例示的な抗Flt3 CARとしては、限定されないが、ALLO-819(Pfizer Inc)およびAMG-553(Amgen Inc)が挙げられる。
様々な実施形態では、CARは、葉酸受容体に特異的に結合する。例示的な抗葉酸受容体CARとしては、限定されないが、EC17/CAR T(Endocyte Inc)が挙げられる。
様々な実施形態では、CARは、G250に特異的に結合する。例示的な抗G250 CARとしては、限定されないが、自己Tリンパ球療法(G250-scFV導入、腎細胞がん)、Erasmus医療センター(Daniel den Hoed Cancer Center)が挙げられる。
様々な実施形態では、CARは、GD2に特異的に結合する。例示的な抗GD2 CARとしては、限定されないが、1RG-CART(University College London)、4SCAR-GD2(Shenzhen Geno-Immune Medical Institute)、C7R-GD2.CART細胞(Baylor College of Medicine)、CMD-501(Baylor College of Medicine)、CSG-GD2(Carsgen Therapeutics Ltd)、GD2-CART01(Bambino Gesu Hospital and Research Institute)、GINAKIT細胞(Baylor College of Medicine)、iC9-GD2-CAR-IL-15 T細胞(UNC Lineberger Comprehensive Cancer Center)、およびIKT-703(Icell Kealex Therapeutics)が挙げられる。
様々な実施形態では、CARは、GD2およびMUC1に特異的に結合する。例示的な抗GD2/MUC1 CARとしては、限定されないが、PSMA CAR-T(University of Pennsylvania)が挙げられる。
様々な実施形態では、CARは、GPC3に特異的に結合する。例示的な抗GPC3 CARとしては、限定されないが、ARB-002.T(Arbele Ltd)、CSG-GPC3(Carsgen Therapeutics Ltd)、GLYCAR(Baylor College of Medicine)、およびTT-14(Tessa Therapeutics Pte Ltd)が挙げられる。
様々な実施形態では、CARは、Her2に特異的に結合する。例示的な抗Her2 CARとしては、限定されないが、ACTR-087+トラスツズマブ(Unum Therapeutics Inc)、ACTR-707+トラスツズマブ(Unum Therapeutics Inc)、CIDeCAR(Bellicum Pharmaceuticals Inc)、MB-103(Mustang Bio Inc)、RB-H21(Refuge Biotechnologies Inc)、およびTT-16(Baylor College of Medicine)が挙げられる。
様々な実施形態では、CARは、IL13Rに特異的に結合する。例示的な抗IL13R CARとしては、限定されないが、MB-101(City of Hope)およびYYB-103(YooYoung Pharmaceuticals Co Ltd)が挙げられる。
様々な実施形態では、CARは、インテグリンβ-7に特異的に結合する。例示的な抗インテグリンβ-7 CARとしては、限定されないが、MMG49 CAR T細胞療法(Osaka University)が挙げられる。
様々な実施形態では、CARは、LC抗原に特異的に結合する。例示的な抗LC抗原CARとしては、限定されないが、VM-803(ViroMed Co Ltd)およびVM-804(ViroMed Co Ltd)が挙げられる。
様々な実施形態では、CARは、メソテリンに特異的に結合する。例示的な抗メソテリンCARとしては、限定されないが、CARMA-hMeso(Johns Hopkins University)、CSG-MESO(Carsgen Therapeutics Ltd)、iCasp9M28z(Memorial Sloan-Kettering Cancer Center)、KD-021(Nanjing Kaedi Biotech Inc)、m-28z-T2(Guangzhou Institutes of Biomedicine and Health)、MesoCART(University of Pennsylvania)、meso-CAR-T +PD-78(MirImmune LLC)、RB-M1(Refuge Biotechnologies Inc)、およびTC-210(TCR2 Therapeutics Inc)が挙げられる。
様々な実施形態では、CARは、MUC1に特異的に結合する。例示的な抗MUC1 CARとしては、限定されないが、抗MUC1 CAR T細胞療法+PD-1ノックアウトT細胞療法(食道がん/NSCLC)、Guangzhou Anjie Biomedical Technology/University of Technology Sydney(Guangzhou Anjie Biomedical Technology Co LTD)、ICTCAR-043(Innovative Cellular Therapeutics Co Ltd)、ICTCAR-046(Innovative Cellular Therapeutics Co Ltd)、P-MUC1C-101(Poseida Therapeutics Inc)、およびTAB-28z(OncoTab Inc)が挙げられる。
様々な実施形態では、CARは、MUC16に特異的に結合する。例示的な抗MUC16 CARとしては、限定されないが、4H1128Z-E27(Eureka Therapeutics Inc)およびJCAR-020(Memorial Sloan-Kettering Cancer Center)が挙げられる。
様々な実施形態では、CARは、nfP2X7に特異的に結合する。例示的な抗nfP2X7 CARとしては、限定されないが、BIL-022c(Biosceptre International Ltd)が挙げられる。
様々な実施形態では、CARは、PSCAに特異的に結合する。例示的な抗PSCA CARとしては、限定されないが、BPX-601(Bellicum Pharmaceuticals Inc)が挙げられる。
様々な実施形態では、CARは、PSMAに特異的に結合する。CIK-CAR.PSMA(Formula Pharmaceuticals Inc)、およびP-PSMA-101(Poseida Therapeutics Inc)。
様々な実施形態では、CARは、ROR1に特異的に結合する。例示的な抗ROR1 CARとしては、限定されないが、JCAR-024(Fred Hutchinson Cancer Research Center)が挙げられる。
様々な実施形態では、CARは、ROR2に特異的に結合する。例示的な抗ROR2 CARとしては、限定されないが、CCT-301-59(F1 Oncology Inc)が挙げられる。
様々な実施形態では、CARは、SLAMF7に特異的に結合する。例示的な抗SLAMF7 CARとしては、限定されないが、UCART-CS1(Cellectis SA)が挙げられる。
様々な実施形態では、CARは、TRBC1に特異的に結合する。例示的な抗TRBC1 CARとしては、AUTO-4(Autolus Therapeutics Limited)が挙げられる。
様々な実施形態では、CARは、TRBC2に特異的に結合する。例示的な抗TRBC2 CARとしては、AUTO-5(Autolus Therapeutics Limited)が挙げられる。
様々な実施形態では、CARは、TSHRに特異的に結合する。例示的な抗TSHR CARとしては、限定されないが、ICTCAT-023(Innovative Cellular Therapeutics Co Ltd)が挙げられる。
様々な実施形態では、CARは、VEGFR-1に特異的に結合する。例示的な抗VEGFR-1 CARとしては、SKLB-083017(Sichuan University)が挙げられる。
様々な実施形態では、CARは、AT-101(AbClon Inc)、AU-101、AU-105、およびAU-180(Aurora Biopharma Inc)、CARMA-0508(Carisma Therapeutics)、CAR-T(Fate Therapeutics Inc)、CAR-T(Cell Design Labs Inc)、CM-CX1(Celdara Medical LLC)、CMD-502、CMD-503、およびCMD-504(Baylor College of Medicine)、CSG-002 and CSG-005(Carsgen Therapeutics Ltd)、ET-1501、ET-1502、およびET-1504(Eureka Therapeutics Inc)、FT-61314(Fate Therapeutics Inc)、GB-7001(Shanghai GeneChem Co Ltd)、IMA-201(Immatics Biotechnologies GmbH)、IMM-005およびIMM-039(Immunome Inc)、ImmuniCAR(TC BioPharm Ltd)、NT-0004 and NT-0009(BioNTech Cell and Gene Therapies GmbH)、OGD-203(OGD2 Pharma SAS)、PMC-005B(PharmAbcine)、ならびにTI-7007(Timmune Biotech Inc)である。
本明細書に記載のキメラ抗原受容体をコードする核酸も本明細書に提供される。一部の実施形態では、核酸は、単離または精製される。エクスビボの核酸の送達は、当該技術分野で既知の方法を使用して達成することができる。例えば、対象から得られた免疫細胞を、キメラ抗原受容体をコードする核酸ベクターで形質転換してもよい。次に、ベクターを使用して、レシピエント免疫細胞を形質転換し、次いで、これらの細胞がキメラ抗原受容体を発現するようにしてもよい。免疫細胞を形質転換する効率的な手段としては、トランスフェクションおよびトランスダクションが挙げられる。かかる方法は、当該技術分野で周知である。例えば、キメラ抗原受容体(および塩基エディターをコードする核酸)をコードする核酸分子を送達するための適用可能な方法は、国際出願第PCT/US2009/040040号、ならびに米国特許第8,450,112号、同第9,132,153号、および同第9,669,058号に見出すことができる(それらの各々は、その全体が本明細書に援用される。加えて、塩基エディターをコードする核酸を送達するための本明細書に記載のこれらの方法およびベクターは、キメラ抗原受容体をコードする核酸を送達するために適用可能である。
細胞外結合ドメイン
本発明のキメラ抗原受容体は、細胞外結合ドメインを含む。本明細書で企図されるキメラ抗原受容体の細胞外結合ドメインは、特定の抗原に対する親和性を有する抗体またはその抗原結合断片のアミノ酸配列を含む。一部の実施形態では、抗原は、CD3である。一部の実施形態では、抗原は、CD5である。一部の実施形態では、抗原は、CD7である。一部の実施形態では、抗原は、CD33である。一部の実施形態では、抗原は、CD123である。
一部の実施形態では、キメラ抗原受容体は、抗体のアミノ酸配列を含む。一部の実施形態では、キメラ抗原受容体は、抗体の抗原結合断片のアミノ酸配列を含む。細胞外結合ドメインの抗体(またはその断片)部分は、抗原のエピトープを認識し、それに結合する。一部の実施形態では、キメラ抗原受容体の抗体断片部分は、単鎖可変断片(scFv)である。scFvは、モノクローナル抗体の軽鎖断片および可変断片を含む。他の実施形態では、キメラ抗原受容体の抗体断片部分は、多鎖可変断片であり、複数の細胞外結合ドメインを含むことができ、したがって、複数の抗原に同時に結合することができる。多鎖可変断片の実施形態では、ヒンジ領域は、異なる可変断片を分離することができ、必要な空間配置および柔軟性を提供する。
他の実施形態では、キメラ抗原受容体の抗体部分は、少なくとも1つの重鎖および少なくとも1つの軽鎖を含む。一部の実施形態では、キメラ抗原受容体の抗体部分は、ジスルフィド架橋によって連結された2つの重鎖、および2つの軽鎖を含み、軽鎖は各々、ジスルフィド架橋によって重鎖のうちの1つに連結される。一部の実施形態では、軽鎖は、定常領域および可変領域を含む。抗体の可変領域に存在する相補性決定領域は、特定の抗原に対する抗体の親和性に関与している。したがって、異なる抗原を認識する抗体は、異なる相補性決定領域を含む。相補性決定領域は、細胞外結合ドメインの可変ドメインに存在し、可変ドメイン(すなわち、重鎖可変領域および軽鎖可変領域)は、リンカーと連結されるか、または一部の実施形態では、ジスルフィド架橋と連結され得る。一部の実施形態では、重鎖可変領域および軽鎖可変領域は、(GGGGS)リンカーによって連結され、nは、1~10の整数である。一部の実施形態では、リンカーは、(GGGGS)リンカーである。
一部の実施形態では、細胞外ドメインによって認識および結合される抗原は、タンパク質もしくはペプチド、核酸、脂質、または多糖である。抗原は、病原性細菌またはウイルスで発現されるものなどの異種であり得る。抗原はまた、合成であってもよく、例えば、いくつかの個体は、合成ラテックスに対して極端なアレルギーを有し、この抗原への曝露は、極端な免疫反応をもたらし得る。一部の実施形態では、抗原は、自己由来であり、病気またはその他の改変された細胞上で発現する。例えば、一部の実施形態では、抗原は、腫瘍細胞で発現する。一部の実施形態では、腫瘍細胞は、固形腫瘍細胞である。他の実施形態では、腫瘍細胞は、液性腫瘍細胞である。他の実施形態では、腫瘍細胞は、B細胞がんなどの血液がんである。一部の実施形態では、B細胞がんは、リンパ腫または白血病である。
本明細書に記載の方法で治療される液体がんは、例えば、白血病であり得る。場合によっては、白血病は、前白血病を含む。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。
腫瘍の非限定的な例としては、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫が挙げられる。一部の実施形態では、腫瘍は、T細胞急性リンパ芽球性白血病(T-ALL)である。一部の実施形態では、腫瘍は、急性骨髄性白血病(AML)である。
抗体-抗原相互作用は、水素結合、静電もしくは疎水性相互作用、またはファンデルワールス力から生じる非共有結合性相互作用である。抗原に対するキメラ抗原受容体の細胞外結合ドメインの親和性は、以下の式で計算することができる:
=[抗体-抗原]/[抗体][抗原]、式中、
[Ab]=抗体上の非占有結合部位のモル濃度、
[Ag]=抗原上の非占有結合部位のモル濃度、および
[Ab-Ag]=抗体-抗原複合体のモル濃度。
抗体-抗原相互作用は、抗原の抗体からの解離に基づいて特徴付けることもできる。解離定数(K)は、解離速度に対する会合速度の比率であり、親和定数に反比例する。したがって、K=1/Kである。当業者は、これらの概念に精通し、ELISAアッセイなどの従来の方法を使用して、これらの定数が計算され得ることを知っているであろう。
膜貫通ドメイン
本発明のキメラ抗原受容体には、膜貫通ドメインが含まれる。本明細書に記載のキメラ抗原受容体の膜貫通ドメインは、CAR-T細胞の脂質二重層細胞膜にまたがり、細胞外結合ドメインと細胞内シグナル伝達ドメインを分離する。一部の実施形態では、このドメインは、膜貫通ドメインを有する他の受容体に由来し、他の実施形態では、このドメインは合成である。一部の実施形態では、膜貫通ドメインは、非ヒト膜貫通ドメインに由来してもよく、一部の実施形態では、ヒト化されてもよい。「ヒト化」とは、膜貫通ドメインをコードする核酸の配列が、ヒト対象においてより確実にまたは効率的に発現されるように最適化されることを意味する。一部の実施形態では、膜貫通ドメインは、ヒト免疫エフェクター細胞において発現された別の膜貫通タンパク質に由来する。かかるタンパク質の例としては、免疫エフェクター細胞において発現され、膜貫通ドメインを有する、T細胞受容体(TCR)複合体のサブユニット、PD1、もしくは表面抗原分類タンパク質のうちのいずれか、または他のタンパク質が挙げられるが、これらに限定されない。一部の実施形態では、膜貫通ドメインは合成であり、そのような配列は多くの疎水性残基を含む。
本開示のCARで使用される膜貫通ドメインは、T細胞受容体のα、β、またはζ鎖、CD28、CD3ε、CD45、CD4、CD5、CD8、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137、CD154の膜貫通領域を少なくとも含むことができる。一部の実施形態では、膜貫通ドメインは、CD4、CD8α、CD28、またはCD3ζに由来する。一部の実施形態では、膜貫通ドメインは、CD28膜貫通ドメインである。一部の実施形態では、膜貫通ドメインは、CD8α膜貫通ドメインである。
一部の実施形態では、膜貫通ドメインは、CD8αヒンジおよび膜貫通ドメインである。一部の実施形態では、CD8αヒンジおよび膜貫通ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
SDPTTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYC
キメラ抗原受容体は、一部の実施形態では、膜貫通ドメインと細胞外ドメインとの間のスペーサー、細胞内ドメイン、またはその両方を含むように設計される。そのようなスペーサーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長であり得る。一部の実施形態では、スペーサーは、20、30、40、50、60、70、80、90、または100アミノ酸長であり得る。さらに他の実施形態では、スペーサーは、100~500アミノ酸長であり得る。スペーサーは、あるドメインを別のドメインに連結する任意のポリペプチドであり得、キメラ抗原受容体の機能を増強または最適化するように、かかる連結されるドメインを配置するのに使用される。一部の実施形態では、ヒンジ/スペーサーは、CH3、CD8α、またはCD28から選択される。
細胞内シグナル伝達ドメイン
本発明のキメラ抗原受容体は、細胞内シグナル伝達ドメインを含む。細胞内シグナル伝達ドメインは、T細胞で発現するタンパク質の細胞内部分であり、T細胞エフェクター機能シグナル(例えば、活性化シグナル)を伝達し、T細胞に特化された機能を行わせるように指示する。T細胞の活性化は、いくつかの要因によって誘導され得、同種抗原が、T細胞の表面上のT細胞受容体に結合すること、および同種リガンドが、T細胞の表面上の共刺激分子に結合すること、が含まれる。T細胞共刺激分子は、T細胞上の同種結合パートナーであり、共刺激リガンドと特異的に結合し、それによって、T細胞による共刺激応答(例えば、限定されないが、増殖)を媒介する。共刺激分子には、MHCクラスI分子が含まれるが、これらに限定されない。T細胞の活性化は、免疫応答(例えば、T細胞の増殖および分化)につながる(例えば、Smith-Garvin et al.,Annu.Rev.Immunol.,27:591-619,2009を参照されたい)。例示的なT細胞シグナル伝達ドメインは、当該技術分野で既知である。非限定的な例としては、CD3ζ、CD8、CD28、CD27、CD154、GITR(TNFRSF18)、CD134(OX40)、およびCD137(4-1BB)のシグナル伝達ドメインが挙げられる。
本明細書で企図されるキメラ抗原受容体の細胞内シグナル伝達ドメインは、一次シグナル伝達ドメインを含む。一部の実施形態では、キメラ抗原受容体は、一次シグナル伝達ドメインおよび二次または共刺激シグナル伝達ドメインを含む。
一部の実施形態では、一次シグナル伝達ドメインは、1つ以上の免疫受容体チロシンベースの活性化モチーフ、またはITAMを含む。一部の実施形態では、一次シグナル伝達ドメインは、2つ以上のITAMを含む。キメラ抗原受容体に組み込まれたITAMは、他の細胞の受容体からのITAMに由来し得る。一部の実施形態では、ITAMを含む一次シグナル伝達ドメインは、CD3γ、CD3ε、CD3ζ、またはCD3δなどのTCR複合体のサブユニットに由来し得る(図1Aを参照)。一部の実施形態では、ITAMを含む一次シグナル伝達ドメインは、FcRγ、FcRβ、CD5、CD22、CD79a、CD79b、またはCD66dに由来し得る。
一部の実施形態では、一次シグナル伝達ドメインは、CD8、CD28、CD134(OX40)、CD137(4-1BB)、およびCD3ζからなる群から選択される。一部の実施形態では、一次シグナル伝達ドメインは、CD3ζシグナル伝達ドメインである。一部の実施形態では、CD3ζシグナル伝達ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR
一部の実施形態では、一次シグナル伝達ドメインは、CD134(OX40)シグナル伝達ドメインである。一部の実施形態では、CD134(OX40)シグナル伝達ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
RRDQRLPPDAHKPPGGGSFRTPIQEEQADAHSTLAKI
一部の実施形態では、二次的または共刺激的シグナル伝達ドメインは、4-1BB、CD2、CD4、CD28、CDS、CD8α、CD83、CD134、CD137、ICOS、またはCD154に由来する。一部の実施形態では、二次シグナル伝達ドメインは、CD28シグナル伝達ドメインである。一部の実施形態では、CD28シグナル伝達ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
SKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS
一部の実施形態では、二次シグナル伝達ドメインは、CD137(4-1BB)シグナル伝達ドメインである。一部の実施形態では、CD137(4-1BB)シグナル伝達ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL
一部の実施形態では、CD137(4-1BB)シグナル伝達ドメインは、以下に提供される例示的なアミノ酸配列と、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%同一である:
RFSVVKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL.
一部の実施形態では、CARは、1つ以上のシグナル伝達ドメインを含む。一部の実施形態では、CARは、4-1BBシグナル伝達ドメインおよびCD3ζシグナル伝達ドメインを含む。一部の実施形態では、CARは、CD28シグナル伝達ドメインおよびCD3ζシグナル伝達ドメインを含む。
免疫細胞における標的遺伝子の編集
本発明は、キメラ抗原(CAR)、および1つ以上の編集された遺伝子、1つ以上のその調節エレメント、またはそれらの組み合わせを含む免疫細胞を提供し、編集された遺伝子の発現は、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、CARおよび改変された内因性遺伝子を含み、フラトリサイドに対する耐性、増強された免疫細胞機能、免疫抑制もしくは免疫阻害に対する耐性、またはそれらの組み合わせを提供する。一部の実施形態では、免疫細胞は、T細胞である。一部の実施形態では、免疫細胞は、CAR-T細胞である。一部の実施形態では、免疫細胞は、NK細胞である。一部の実施形態では、各編集された遺伝子は、単一の塩基編集を含んでもよい。一部の実施形態では、各編集された遺伝子は、遺伝子の異なる領域に複数の塩基編集を含んでもよい。
一部の実施形態では、単一の修飾事象(例えば、エレクトロポレーション)は、1つ以上の遺伝子編集を導入し得る。一部の実施形態では、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上の編集が、1つ以上の遺伝子に同時に導入され得る。一部の実施形態では、免疫細胞(前述の遺伝子編集のうちのいずれかから選択される編集された遺伝子を含む任意の免疫細胞が含まれるが、これらに限定されない)を編集して、CAR-Tの機能を増強するか、または細胞の免疫抑制もしくは免疫阻害を低減する他の遺伝子に変異を生成することができる。
一部の実施形態では、CAR-T細胞は、類似のCAR-T細胞と比較して、増加したフラトリサイド耐性を有するが、本明細書に記載される1つ以上の編集された遺伝子をさらに有することはない。一部の実施形態では、CAR-T細胞は、類似のCAR-T細胞と比較して、低減された免疫原性を有するが、本明細書に記載される1つ以上の編集された遺伝子をさらに有することはない。一部の実施形態では、CAR-T細胞は、類似のCAR-Tと比較して、より低い活性化閾値を有するが、本明細書に記載される1つ以上の編集された遺伝子をさらに有することはない。一部の実施形態では、CAR-T細胞は、類似のCAR-T細胞と比較して、増加した抗腫瘍活性を有するが、本明細書に記載される1つ以上の編集された遺伝子をさらに有することはない。
一部の実施形態では、内因性遺伝子またはその調節エレメントに少なくとも1つの修飾を有する免疫細胞が本明細書に提供される。一部の実施形態では、免疫細胞は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上の内因性遺伝子またはその調節エレメントにおけるさらなる修飾を含み得る。
一部の実施形態では、1つ以上の遺伝子、または1つ以上のその調節エレメント、またはそれらの組み合わせは、CD3抗原(CD3)、CD5抗原(CD5)、CD7抗原(CD7)、CD33抗原(CD33)、CD52抗原(CD52)、CD123抗原(CD123)、T細胞受容体α定常領域(TRAC)、プログラム細胞死1(PDCD1またはPD-1)、Fas細胞表面細胞死受容体(FAS)、リンパ球活性化遺伝子3(LAG-3)、クラスII主要組織適合複合体活性化因子(CIITA)、T細胞受容体β定常領域1(TRBC1)、T細胞受容体β定常領域2(TRBC2)、およびβ2マイクログロブリン(B2M)からなる群から選択され得る。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123が編集される。一部の実施形態では、免疫細胞は、編集されたCD3遺伝子、および加えて、少なくとも1つの編集された遺伝子を含む。一部の実施形態では、免疫細胞は、編集されたCD5遺伝子、および加えて、少なくとも1つの編集された遺伝子を含む。一部の実施形態では、免疫細胞は、編集されたCD7遺伝子、および加えて、少なくとも1つの編集された遺伝子を含む。一部の実施形態では、免疫細胞は、編集されたCD33遺伝子、および加えて、少なくとも1つの編集された遺伝子を含む。一部の実施形態では、免疫細胞は、編集されたCD123遺伝子、および加えて、少なくとも1つの編集された遺伝子を含む。少なくとも1つの編集された遺伝子は、先行する段落で言及された遺伝子のリストから選択され得る。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123は、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上と組み合わせて編集される。
様々な実施形態では、修飾免疫細胞は、CD5、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1、またはそれらの組み合わせのうちの1つ以上における変異を含む。様々な実施形態では、修飾免疫細胞は、CD5、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの2、3、4、5、6、7、8、9、または10個における変異を含む。様々な実施形態では、修飾免疫細胞は、CD5における変異と、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異と、を含む。一実施形態では、修飾免疫細胞は、CD5、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1における変異を含む。
様々な実施形態では、修飾免疫細胞は、CD7、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD7、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの2、3、4、5、6、7、8、9、または10個における変異を含む。様々な実施形態では、修飾免疫細胞は、CD7における変異と、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異と、を含む。一実施形態では、修飾免疫細胞は、CD7、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1における変異を含む。
様々な実施形態では、修飾免疫細胞は、CD3、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD3、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの2、3、4、5、6、7、8、9、または10個における変異を含む。様々な実施形態では、修飾免疫細胞は、CD3における変異と、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異と、を含む。一実施形態では、修飾免疫細胞は、CD3、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1における変異を含む。
様々な実施形態では、修飾免疫細胞は、CD33、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD33、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの2、3、4、5、6、7、8、9、または10個における変異を含む。様々な実施形態では、修飾免疫細胞は、CD33における変異と、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異と、を含む。一実施形態では、修飾免疫細胞は、CD33、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1における変異を含む。
様々な実施形態では、修飾免疫細胞は、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの2、3、4、5、6、7、8、9、または10個における変異を含む。様々な実施形態では、修飾免疫細胞は、CD123における変異と、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1のうちの1つ以上、またはそれらの組み合わせにおける変異と、を含む。一実施形態では、修飾免疫細胞は、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1における変異を含む。
一部の実施形態では、少なくとも1つの修飾は、単一の核酸塩基修飾である。一部の実施形態では、修飾された内因性遺伝子は、塩基編集によって作製され得る。一部の実施形態では、塩基編集は、遺伝子発現を減少または減弱させ得る。一部の実施形態では、塩基編集は、遺伝子活性化を減少または減弱させ得る。一部の実施形態では、塩基編集は、遺伝子産物の機能性を減少または減弱させ得る。一部の他の実施形態では、塩基編集は、遺伝子発現を活性化または強化し得る。一部の実施形態では、塩基編集は、遺伝子産物の機能性を増加させ得る。
内因性免疫細胞受容体ならびにキメラ抗原受容体を発現する同種免疫細胞は、移植片対宿主病(GVHD)と呼ばれる状況で、宿主細胞を認識および攻撃し得る。免疫細胞受容体複合体のα成分は、TRAC遺伝子によってコードされ、一部の実施形態では、この遺伝子は、TCR複合体のαサブユニットが非機能的であるか、または存在しないように編集される。このサブユニットは内因性免疫細胞シグナル伝達に必要であるため、この遺伝子を編集することで、同種免疫細胞によって引き起こされる移植片対宿主病のリスクを低減することができる。
一部の実施形態では、フラトリサイド耐性を提供するか、免疫細胞の機能を増強するか、または免疫抑制もしくは免疫阻害を低減するための遺伝子の編集は、免疫細胞において、細胞がキメラ抗原受容体を発現するように形質転換される前に行われ得る。他の態様では、免疫細胞の機能を増強するか、または免疫抑制もしくは免疫阻害を低減するための遺伝子の編集は、CAR-T細胞において、すなわち、免疫細胞がキメラ抗原受容体を発現するように形質転換された後で行われ得る。
本発明の一部の実施形態では、CD5遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。次いで、CAR-Tを形質転換して、CD5 scFvを有するキメラ抗原受容体を発現させる。CD5遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾CAR-T細胞がフラトリサイドを行う可能性が低くなる。
本発明の一部の実施形態では、CD7遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。次いで、CAR-Tを形質転換して、CD7 scFvを有するキメラ抗原受容体を発現させる。CD7遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾CAR-T細胞がフラトリサイドを行う可能性が低くなる。
本発明の一部の実施形態では、CD33遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。次いで、CAR-Tを形質転換して、CD33 scFvを有するキメラ抗原受容体を発現させる。CD33遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾CAR-T細胞がフラトリサイドを行う可能性が低くなる。
本発明の一部の実施形態では、CD3遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。次いで、CAR-Tを形質転換して、CD3 scFvを有するキメラ抗原受容体を発現させる。CD3遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾CAR-T細胞がフラトリサイドを行う可能性が低くなる。
本発明の一部の実施形態では、CD123遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。次いで、CAR-Tを形質転換して、CD123 scFvを有するキメラ抗原受容体を発現させる。CD123遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾CAR-T細胞がフラトリサイドを行う可能性が低くなる。
宿主免疫細胞は、同種CAR-T細胞を非自己として潜在的に認識し、免疫応答を誘発して、非自己細胞を除去することができる。B2Mは、ほぼすべての有核細胞において発現され、MHCクラスI複合体と会合している(図1B)。循環宿主CD8T細胞は、このB2Mタンパク質を非自己として認識し、同種細胞を死滅させることができる。この移植片拒絶を克服するために、一部の実施形態では、B2M遺伝子は、発現をノックアウトまたはノックダウンするように編集される。一部の実施形態では、編集されたB2M遺伝子を有する免疫細胞が本明細書に提供され、そのため、免疫細胞は、内因性の機能的なB2Mを発現しない。一部の実施形態では、編集されたB2M遺伝子を有するCAR-T細胞が本発明に提供され、そのため、CAR-T細胞は、内因性B2Mの低下した発現、無視できる発現、または発現の不在を示す。
一部の実施形態では、免疫細胞は、キメラ抗原受容体と、1つ以上の編集された遺伝子、それらの調節エレメント、またはそれらの組み合わせと、を含む。編集された遺伝子は、免疫応答調節遺伝子、免疫原性遺伝子、チェックポイント阻害因子遺伝子、免疫応答に関与する遺伝子、細胞表面マーカー、例えばT細胞表面マーカー、またはそれらの任意の組み合わせであり得る。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、活性化T細胞増殖、α-βT細胞活性化、γ-δT細胞活性化、T細胞増殖の正の調節、Tヘルパー細胞の増殖もしくは分化の負の調節、またはそれらの調節エレメント、またはそれらの組み合わせに関連する編集された遺伝子とを含む。一部の実施形態では、編集された遺伝子は、チェックポイント阻害因子遺伝子(例えば、PD1遺伝子、PDC1遺伝子、またはそれらの形成もしくは活性化の経路に関連もしくは調節するメンバー)であり得る。一部の実施形態では、編集された遺伝子は、TRAC遺伝子である。一部の実施形態では、編集された遺伝子は、CD5遺伝子である。一部の実施形態では、編集された遺伝子は、CD7遺伝子である。一部の実施形態では、編集された遺伝子は、CD33遺伝子である。一部の実施形態では、編集された遺伝子は、CD3遺伝子である。一部の実施形態では、編集された遺伝子は、CD123遺伝子である。一部の実施形態では、編集された遺伝子は、B2M遺伝子である。一部の実施形態では、編集された遺伝子は、CIITA遺伝子である。一部の実施形態では、編集された遺伝子は、TRBC1/2遺伝子である。一部の実施形態では、編集された遺伝子は、CD5遺伝子である。一部の実施形態では、編集された遺伝子は、CD7遺伝子である。一部の実施形態では、編集された遺伝子は、CD52遺伝子である。一部の実施形態では、少なくとも1つの遺伝子が編集され、PD-1、CD2、CD3、CD5、CD7、CD52、B2M、TRBC1/2、CIITA、およびTRAC、またはそれらの組み合わせから選択される。一部の実施形態では、PD-1、CD2、CD52、およびTRAC遺伝子が編集される。一部の実施形態では、PD-1、CD2、CD52、B2M、TRBC1/2、CIITA、およびTRAC遺伝子が編集される。一部の実施形態では、PD-1、CD5、CD52、およびTRAC遺伝子が編集される。一部の実施形態では、PD-1、CD3、CD7、およびCD52遺伝子が編集される。
一部の実施形態では、内因性遺伝子の編集は、遺伝子の発現を低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも50%低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも60%低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも70%低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも80%低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも90%低下させる。一部の実施形態では、内因性遺伝子の編集は、修飾を伴わない対照細胞と比較して、遺伝子の発現を少なくとも100%低下させる。一部の実施形態では、内因性遺伝子の編集は、遺伝子発現を排除する。
本発明の一部の実施形態では、PDCD1遺伝子は、CAR-T細胞において、発現をノックアウトまたはノックダウンするように編集される。PDCD1遺伝子は、免疫細胞で発現する免疫系チェックポイントである細胞表面受容体PD-1をコードし、抗原特異的な免疫細胞のアポトーシスを促進することによって、自己免疫の低減に関与する。PDCD1遺伝子の発現をノックアウトまたはノックダウンすることにより、修飾されたCAR-T細胞は、アポトーシスを起こす可能性がより低く、増殖する可能性がより高く、プログラム細胞死免疫チェックポイントから回避することができる。
CBLB遺伝子は、免疫エフェクター細胞活性化の阻害に重要な役割を果たすE3ユビキチンリガーゼをコードする。図1Cを参照すると、CBLBタンパク質は、免疫エフェクター細胞の寛容性をもたらすシグナル伝達経路に有利に働き、免疫エフェクター細胞の活性化をもたらすシグナル伝達を能動的に阻害する。免疫エフェクター細胞の活性化は、CAR-T細胞が移植後にインビボで増殖するために必要であることから、本発明の一部の実施形態では、CBLB遺伝子は、発現がノックアウトまたはノックダウンされるように編集される。
一部の実施形態では、編集されたTRAC遺伝子(ここで、TRAC遺伝子は、1、2、3、4、5、6、7、8、9、10個、またはそれ以上の塩基編集を含み得る)を有する免疫細胞が本明細書に提供され、そのため、免疫細胞は、内因性の機能的なT細胞受容体α鎖を発現しない。一部の実施形態では、免疫細胞は、キメラ抗原受容体を発現するT細胞(CAR-T細胞)である。一部の実施形態では、TRAC遺伝子に塩基編集を有するCAR-T細胞が本発明に提供され、そのため、CAR-T細胞は、内因性のT細胞受容体αタンパク質の低下した発現、無視できる発現、または無発現を有する。
一部の実施形態では、編集されたCIITA遺伝子を有する免疫細胞が本明細書に提供され、そのため、免疫細胞は、内因性の機能的なクラスII主要組織適合複合体トランスアクチベーターを発現しない。一部の実施形態では、編集されたCIITA遺伝子を有するCAR-T細胞が本発明に提供され、そのため、CAR-T細胞は、内因性のクラスII主要組織適合複合体トランスアクチベーターの低下した発現、無視できる発現、または無発現を示す。
一部の実施形態では、編集されたTRBC1またはTRBC2遺伝子を有する免疫細胞が本明細書に提供され、そのため、免疫細胞は、内因性の機能的なT細胞受容体β鎖を発現しない。一部の実施形態では、編集されたTRBC1/TRBC2遺伝子を有するCAR-T細胞が本明細書に提供され、そのため、CAR-T細胞は、内因性T細胞受容体β鎖の低下した発現、無視できる発現、または無発現を示す。
一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRAC、B2M、PDCD1、CBLB遺伝子、またはそれらの組み合わせと、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRAC遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRACおよびB2M遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRACおよびPDCD1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRACおよびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRAC、B2M、およびPDCD1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRAC、B2M、およびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞または免疫エフェクター細胞は、キメラ抗原受容体と、編集されたTRAC、PDCD1、およびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原と、編集されたTRAC、B2M、PDCD1、およびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたB2M遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたB2MおよびPDCD1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたB2MおよびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたB2M、PDCD1、およびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたPDCD遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたPDCDおよびCBLB遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCBLBと、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。
一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD5遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD7遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD33遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD3遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD123遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたFAS遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたLAG-3遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCIITA遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRBC1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTRBC2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたCD52遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、1つ以上の編集されたCD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、および/またはPD1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。
塩基編集は、遺伝子の任意の好適な位置に、または遺伝子の調節エレメントに配置されてもよい。したがって、開始コドンにおける単一の塩基編集は、例えば、遺伝子の発現を完全に消失させ得ることが理解され得る。一部の実施形態では、改変された内因性遺伝子は、エキソン、イントロン、エキソン-イントロン命令、またはそのそれらの調節エレメントにおいて修飾または編集され得る。修飾は、遺伝子またはその調節エレメントにおける単一の核酸塩基に編集され得る。修飾は、エキソン、複数のエキソン、イントロン、もしくは複数のイントロン、またはそれらの組み合わせ内にあり得る。修飾は、遺伝子のオープンリーディングフレーム内にあり得る。修飾は、遺伝子の非翻訳領域(例えば、3’-UTRまたは5’-UTR)内にあり得る。一部の実施形態では、修飾は、内因性遺伝子の調節エレメント内にある。一部の実施形態では、修飾は、プロモーター、エンハンサー、オペレーター、サイレンサー、インスレーター、ターミネーター、転写開始配列、翻訳開始配列(例えば、コザック配列)、またはそれらの任意の組み合わせ内にある。一部の実施形態では、塩基編集により、エキソンに未熟終止コドンが導入されてもよく、翻訳産物の欠如もしくは切断(ミスフォールディングされ、それによって、分解により排除され得る)をもたらすか、または不安定なmRNA(容易に分解される)を産生し得る。
一部の実施形態では、塩基編集は、例えば、ヒトPDC1/PD-1遺伝子のエキソン1、エキソン2、またはエキソン3、またはエキソン4、またはエキソン5で行われ得る。一部の実施形態では、ヒトPDC1/PD-1遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトPDC1/PD-1遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトPDC1/PD-1遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトPDC1/PD-1遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトPDC1/PD-1遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトPDC1/PD-1遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、またはそれらの任意の組み合わせで行われ得る。
一部の実施形態では、ヒトPDC1/PD-1A遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置4、6、7、8、または9を編集することによって行われる。一部の実施形態では、ヒトPDC1/PD-1A遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置4、6、7、8、または9を編集することによって行われる。一部の実施形態では、ヒトPDC1/PD-1A遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置7、8または9を編集することによって行われる。一部の実施形態では、ヒトPDC1/PD-1A遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置5、7、または8を編集することによって行われる。一部の実施形態では、ヒトPDC1/PD-1A遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置5または8を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCD7遺伝子のエキソン1、エキソン2、またはエキソン3で行われ得る。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCD7遺伝子に対して、エキソン1、エキソン2、エキソン3、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン1内の位置4、8、9で行われる。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置5、6、7、8、または9を編集することによって行われる。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置4または9を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトLAG-3遺伝子のエキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、またはエキソン8で行われ得る。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン6内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン7内の部位で行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン8内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトLAG-3遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、エキソン8、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置4または8を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置4、6、または8を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置4、5、6、または7を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置4、8、または9を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置8または9を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン6を標的とするガイドRNAスペーサー配列の位置4、6、7、または8を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン7を標的とするガイドRNAスペーサー配列の位置4、6、または7を編集することによって行われる。一部の実施形態では、ヒトLAG-3遺伝子における塩基編集は、エキソン8を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCD33遺伝子のエキソン1、エキソン2、エキソン3、エキソン4、エキソン5、またはエキソン6で行われ得る。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン6内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCD33遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置7、8、または9を編集することによって行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置4、5、6、または8を編集することによって行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置4、5、6、または7を編集することによって行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置6または7を編集することによって行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置7または8を編集することによって行われる。一部の実施形態では、ヒトCD33遺伝子における塩基編集は、エキソン6を標的とするガイドRNAスペーサー配列の位置4、5、または6を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCD123遺伝子のエキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン7、エキソン8、エキソン10、またはエキソン11で行われ得る。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン7内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン8内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン10内の部位で行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン11内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCD123遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン7、エキソン8、エキソン10、エキソン11、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置6を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置4、6、または8を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置5、6、または8を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置5または6を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置4または5を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン7を標的とするガイドRNAスペーサー配列の位置5を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン8を標的とするガイドRNAスペーサー配列の位置5、6、7、または8を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン10を標的とするガイドRNAスペーサー配列の位置4、7、または8を編集することによって行われる。一部の実施形態では、ヒトCD123遺伝子における塩基編集は、エキソン11を標的とするガイドRNAスペーサー配列の位置5または8を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトFAS遺伝子のエキソン1、またはエキソン3、またはエキソン4、またはエキソン5、またはエキソン6、またはエキソン7、またはエキソン8、またはエキソン9で行われ得る。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトFASにおける塩基編集は、エキソン6内の部位で行われる。一部の実施形態では、ヒトFASにおける塩基編集は、エキソン7内の部位で行われる。一部の実施形態では、ヒトFASにおける塩基編集は、エキソン8内の部位で行われる。一部の実施形態では、ヒトFASにおける塩基編集は、エキソン9内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトFAS遺伝子に対して、エキソン1、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、エキソン8、エキソン9、またはそれらの任意の組み合わせで行われ得る。
一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置9を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置6を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置7を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置5を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン6を標的とするガイドRNAスペーサー配列の位置4または7を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン7を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン8を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。一部の実施形態では、ヒトFAS遺伝子における塩基編集は、エキソン9を標的とするガイドRNAスペーサー配列の位置5または6を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCD52遺伝子のエキソン1、エキソン2、またはエキソン3で行われ得る。一部の実施形態では、ヒトCD52遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCD52遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCD7遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCD52遺伝子に対して、エキソン1、エキソン2、エキソン3、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトCD52遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置4または7を編集することによって行われる。一部の実施形態では、ヒトCD52遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置5、6、または7を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCD5遺伝子のエキソン1、エキソン2、またはエキソン3、またはエキソン4、またはエキソン5、またはエキソン6、またはエキソン7、またはエキソン8、またはエキソン9、またはエキソン10で行われ得る。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン6内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン7内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン8内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン9内の部位で行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン10内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCD5遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、エキソン8、エキソン9、エキソン10、またはそれらの任意の組み合わせで行われ得る。
一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置6を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置6を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置5および/または6を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置5および/または6を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置5、6、8および/または9を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置4または5を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン5を標的とするガイドRNAスペーサー配列の位置4、5、7、8または9を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン6を標的とするガイドRNAスペーサー配列の位置4、5、6、7、8、および/または9を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン7を標的とするガイドRNAスペーサー配列の位置4を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン8を標的とするガイドRNAスペーサー配列の位置4、5、または7を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン9を標的とするガイドRNAスペーサー配列の位置6または8を編集することによって行われる。一部の実施形態では、ヒトCD5遺伝子における塩基編集は、エキソン10を標的とするガイドRNAスペーサー配列の位置9を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトTRAC遺伝子(UCSCゲノムデータベースENSG00000277734.8)のエキソン1、またはエキソン2、またはエキソン3、またはエキソン4で行われ得る。一部の実施形態では、ヒトTRAC遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトTRAC遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトTRAC遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトTRAC遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトTRAC遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトTRAC遺伝子における塩基編集は、エキソン1内のガイドRNAスペーサー配列を標的とする位置5、6、または9で編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトB2M遺伝子(染色体15,NC_000015.10,44711492-44718877;例示的なmRNA配列NM_004048)のエキソン1、エキソン2、エキソン3、またはエキソン4で行われ得る。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトB2M遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置5を編集することによって行われる。一部の実施形態では、ヒトB2M遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置4、6、または9を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトCIITA遺伝子のエキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、エキソン8、エキソン9、エキソン10、エキソン11、エキソン12、エキソン13、エキソン14、エキソン15、エキソン16、エキソン17、エキソン18、またはエキソン19で行われ得る。一部の実施形態では、ヒトCD52遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン4内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン5内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン6内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン7内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン8内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン9内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン10内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン11内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン12内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン13内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン14内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン15内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン16内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン17内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン18内の部位で行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン19内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトCIITA遺伝子に対して、エキソン1、エキソン2、エキソン3、エキソン4、エキソン5、エキソン6、エキソン7、エキソン8、エキソン9、エキソン10、エキソン11、エキソン12、エキソン13、エキソン14、エキソン15、エキソン16、エキソン17、エキソン18、エキソン19、またはそれらの任意の組み合わせで行われ得る。
一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置6または7を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置7または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン4を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン7を標的とするガイドRNAスペーサー配列の位置4、7または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン8を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン9を標的とするガイドRNAスペーサー配列の位置4、6、または7を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン10を標的とするガイドRNAスペーサー配列の位置4、5、または7を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン11を標的とするガイドRNAスペーサー配列の位置4、5、6、7、または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン12を標的とするガイドRNAスペーサー配列の位置6を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン14を標的とするガイドRNAスペーサー配列の位置4または5を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン15を標的とするガイドRNAスペーサー配列の位置4、7、または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン16を標的とするガイドRNAスペーサー配列の位置5、7、または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン17を標的とするガイドRNAスペーサー配列の位置7または8を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン18を標的とするガイドRNAスペーサー配列の位置5を編集することによって行われる。一部の実施形態では、ヒトCIITA遺伝子における塩基編集は、エキソン19を標的とするガイドRNAスペーサー配列の位置5、6、7、または8を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトTRBC1遺伝子のエキソン1、エキソン2、またはエキソン3で行われ得る。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトTRBC1遺伝子に対して、エキソン1、エキソン2、エキソン3、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置5、6、7、または8を編集することによって行われる。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置8を編集することによって行われる。一部の実施形態では、ヒトTRBC1遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置4または5を編集することによって行われる。
一部の実施形態では、塩基編集は、例えば、ヒトTRBC2遺伝子のエキソン1、エキソン2、またはエキソン3で行われ得る。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン1内の部位で行われる。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン2内の部位で行われる。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン3内の部位で行われる。一部の実施形態では、1つ以上の塩基編集作用は、ヒトTRBC2遺伝子に対して、エキソン1、エキソン2、エキソン3、またはそれらの任意の組み合わせで行われ得る。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン1を標的とするガイドRNAスペーサー配列の位置5、6、7、または8を編集することによって行われる。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン2を標的とするガイドRNAスペーサー配列の位置7または8を編集することによって行われる。一部の実施形態では、ヒトTRBC2遺伝子における塩基編集は、エキソン3を標的とするガイドRNAスペーサー配列の位置4を編集することによって行われる。
一部の実施形態では、塩基編集は、イントロンで行われ得る。例えば、塩基編集は、イントロンで行われてもよい。一部の実施形態では、塩基編集は、イントロン内の部位で行われ得る。一部の実施形態では、塩基編集は、1つ以上のイントロンの部位で行われ得る。一部の実施形態では、塩基編集は、遺伝子の複数のイントロンの任意のエキソンで行われ得る。一部の実施形態では、1つ以上の塩基編集は、エキソン、イントロン、またはエキソンおよびイントロンの任意の組み合わせで行われ得る。
一部の実施形態では、修飾または塩基編集は、プロモーター部位内であり得る。一部の実施形態では、塩基編集は、選択的プロモーター部位内に導入され得る。一部の実施形態では、ベース編集は、エンハンサーなどの5’調節エレメント内にあり得る。一部の実施形態では、塩基編集を導入して、核酸結合タンパク質の結合部位を破壊することができる。例示的な核酸結合タンパク質は、ポリメラーゼ、ヌクレアーゼ、ジャイレース、トポイソメラーゼ、メチラーゼまたはメチルトランスフェラーゼ、転写因子、エンハンサー、PABP、ジンクフィンガータンパク質などであり得る。
一部の実施形態では、塩基編集は、標的タンパク質発現をサイレンシングするためのスプライス破壊のために使用され得る。一部の実施形態では、塩基編集は、スプライスアクセプター-スプライスドナー(SA-SD)部位を生成することができる。SA-SDを生成する標的化塩基編集、またはSA-SD部位での標的化塩基編集は、遺伝子の発現の低下をもたらし得る。一部の実施形態では、塩基編集(例えば、ABE、CBE)は、スプライスアクセプターおよびスプライスドナー部位(各イントロンの最初と最後の2つのヌクレオチドである)を構成するジヌクレオチドモチーフを標的化するために使用される。例えば、CD2のエキソン3のスプライスドナー(SD)部位は、塩基編集のために標的化され得る。一部の実施形態では、スプライス破壊は、アデノシン塩基エディター(ABE)で達成される。一部の実施形態では、スプライス破壊は、シチジン塩基エディター(CBE)で達成される。一部の実施形態では、塩基エディター(例えば、ABE、CBE)は、終止コドン(STOP codon)を作成することによってエキソンを編集するために使用される。未熟終止コドンは、エキソン、イントロン、または非翻訳領域で生成され得る。一部の実施形態では、塩基編集を使用して、1つ以上の選択的リーディングフレームに複数の終止コドンを導入することができる。例えば、未熟終止コドンは、エキソン2内の位置8、エキソン3内の位置4、エキソン3内の位置6、エキソン3内の位置9、エキソン4内の位置4、エキソン4内の位置5、またはエキソン5内の位置4で導入され得る。一部の実施形態では、終止コドンは、アデノシン塩基エディター(ABE)によって生成される。一部の実施形態では、終止コドンは、シチジン塩基エディター(CBE)によって生成される。一部の実施形態では、CBEは、終止コドンを生成するために、以下の編集(下線部のフォントで示される)のうちのいずれか1つを生成する:
CAG→TAG; CAA→TAA; CGA→TGA; TGG→TGA; TGG→TAG; または TGG→TAA
一部の実施形態では、修飾/塩基編集は、3’-UTR、例えば、ポリアデニル化(ポリA)部位に導入され得る。一部の実施形態では、塩基編集は、5’-UTR領域上で行われ得る。
一部の実施形態では、免疫細胞(前述の遺伝子編集のうちのいずれかを含む任意の免疫細胞が含まれるが、これらに限定されない)を編集して、CAR-Tの機能を増強するか、または細胞の免疫抑制もしくは免疫阻害を低減する他の遺伝子に変異を生成することができる。例えば、一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2、ZAP70、NFATc1、TET2遺伝子、またはそれらの組み合わせと、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2およびZAP70遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2およびZAP70遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2およびNFATC1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2、ZAP70、およびNFATC1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2、ZAP70、およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTGFBR2、NFATC1、およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原および編集されたTGFBR2、ZAP70、NFATC1、およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたZAP70遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたZAP70およびNFATC1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたZAP70およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたZAP70、PDCD1、およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたPDCD1遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたPDCD1およびTET2遺伝子と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。一部の実施形態では、免疫細胞は、キメラ抗原受容体と、編集されたTET2と、を含み、編集された遺伝子の発現が、ノックアウトまたはノックダウンされる。
一部の実施形態では、キメラ抗原受容体は、TRAC遺伝子に挿入される。これには利点がある。第一に、TRACは免疫細胞で高度に発現しているため、キメラ抗原受容体をTRAC遺伝子に挿入して、受容体の発現がTRACプロモーターによって駆動されるようにその構築物を設計すると、キメラ抗原受容体が同様に発現するであろう。第二に、キメラ抗原受容体をTRAC遺伝子に挿入すると、TRACの発現がノックアウトされるであろう。一部の実施形態では、本明細書に記載の遺伝子編集システムを使用して、キメラ抗原受容体をTRAC遺伝子座に挿入することができる。TRAC遺伝子座に特異的なgRNAは、遺伝子編集システムをその遺伝子座に誘導し、二本鎖DNA切断を開始することができる。特定の実施形態では、gRNAは、Cas12bと組み合わせて使用される。様々な実施形態では、遺伝子編集システムは、CAR受容体をコードする配列を有する核酸と併せて使用される。以下の表1Aに、例示的なガイドRNAが提供される。
DNA構築物は、キメラ抗原受容体と、gRNAの標的化配列に隣接する延びた一続きのTRAC DNAを含む核酸と、をコードする。理論に縛られることなく、構築物は、相補的なTRAC配列に結合し、次いで、構築物上のTRAC配列に近接して存在するキメラ抗原受容体のDNAが、破壊部位に挿入され、TRAC遺伝子が効果的にノックアウトされ、かつキメラ抗原受容体核酸がノックインされる。表1Bは、TRAC遺伝子のガイドRNAを提供する。これは、塩基編集機構をTRAC遺伝子座に誘導することができ、キメラ抗原受容体核酸の挿入を可能にする。最初の11個のgRNAは、BhCas12bヌクレアーゼ用である。第2のセットの11個は、BvCas12bヌクレアーゼ用である。これらはすべて、二本鎖切断を生成することによって、CARをTRACに挿入するためのものであり、塩基編集のためのものではない。

最初の11個のgRNAは、BhCas12bヌクレアーゼ用である。第2のセットの11個は、BvCas12bヌクレアーゼ用である。太字は足場配列(最初の例において)。
一部の実施形態では、本発明のキメラ抗原受容体をコードする核酸は、BE4塩基エディターを使用してTRAC遺伝子座を標的化することができる。一部の実施形態では、キメラ抗原受容体は、CRISPR/Cas9塩基編集システムを使用してTRAC遺伝子座を標的とする。
上に記載の遺伝子編集を生成するために、免疫細胞を対象から収集し、2つ以上のガイドRNAおよび核酸塩基エディターポリペプチド(核酸プログラマブルDNA結合タンパク質(napDNAbp)とシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む)と接触させる。一部の実施形態では、収集された免疫細胞は、少なくとも1つの核酸と接触する。ここで、少なくとも1つの核酸は、2つ以上のガイドRNAおよび核酸塩基エディターポリペプチド(核酸プログラマブルDNA結合タンパク質(napDNAbp)とシチジンデアミナーゼとを含む)をコードする。一部の実施形態では、gRNAは、ヌクレオチド類似体を含む。これらのヌクレオチド類似体は、細胞プロセスによるgRNAの分解を阻害することができる。表2は、使用されるgRNAの標的配列を提供する。
本発明で使用されるシチジンデアミナーゼおよびアデノシンデアミナーゼ核酸塩基エディターは、一本鎖DNAを含むDNAに作用することができる。それらを使用して、免疫細胞の標的核酸塩基配列における修飾を生成する方法が提示される。
特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質のいずれかは、減少したヌクレアーゼ活性を有するCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、または二重鎖DNA分子の1つの鎖を切断するCas9ドメイン(Cas9ニッカーゼ(nCas9)と称される)を有し得る。任意の特定の理論に拘束されることを望むものではないが、触媒残基(例えば、H840)の存在により、標的核酸塩基の反対側の未編集(例えば、メチル化されていない)鎖を切断するCas9の活性が維持される。触媒残基の変異(例えば、D10からA10)は、標的A残基を含む編集された鎖の切断を防ぐ。かかるCas9バリアントは、gRNAで定義された標的配列に基づいて、特定の位置で一本鎖DNA切断(ニック)を生成することができ、未編集鎖の修復をもたらし、最終的には、未編集鎖で核酸塩基の変化をもたらす。
核酸塩基エディター
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾、または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと、核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)と、を含む、核酸塩基エディターまたは核酸塩基エディターが本明細書に記載される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と併せた場合、標的ポリヌクレオチド配列に特異的に結合し(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)、それによって、塩基エディターを編集が望まれる標的核酸配列に局在化させ得る。一部の実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、RNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。
ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラマブルタンパク質を含み得ることを理解されたい。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、核酸と会合することができ、これが、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインをRNAに誘導する。また、他の核酸プログラマブルDNA結合タンパク質も本開示の範囲内であるが、それらは本開示に具体的に列挙されていない。
塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、「エキソヌクレアーゼ」という用語は、遊離末端から核酸(例えば、RNAまたはDNA)を分解することができるタンパク質またはポリペプチドを指し、「エンドヌクレアーゼ」という用語は、核酸(例えば、DNAまたはRNA)内の内部領域を触媒(例えば、切断)することができるタンパク質またはポリペプチドを指す。一部の実施形態では、エンドヌクレアーゼは、二本鎖核酸の1つの鎖を切断することができる。一部の実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0、1、または2本の鎖を切断することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、「ニッカーゼ」という用語は、二重鎖核酸分子(例えばDNA)の2本鎖のうちの1つの鎖のみを切断することができるヌクレアーゼドメインを含む、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指す。一部の実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラマブルヌクレオチド結合ドメインに1つ以上の変異を導入することによって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの完全な触媒活性(例えば、天然)形態に由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインが、Cas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、D10A変異および位置840のヒスチジンを含み得る。かかる実施形態では、残基H840は、触媒活性を保持し、それによって、核酸二重鎖の一本鎖を切断することができる。別の例では、Cas9由来のニッカーゼドメインは、H840A変異を含んでもよいが、位置10のアミノ酸残基はDのままである。一部の実施形態では、ニッカーゼは、ニッカーゼ活性に必要とされないヌクレアーゼドメインの全部または一部を除去することによって、完全に触媒活性な(例えば、天然の)形態のポリヌクレオチドプログラマブルヌクレオチド結合ドメインに由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。
例示的な触媒活性Cas9のアミノ酸配列は、以下のとおりである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
したがって、ニッカーゼドメインを含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば、結合したガイド核酸の相補配列によって決定される)で一本鎖DNA切断(ニック)を生成することができる。一部の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン)を含む塩基エディターによって切断される核酸二重鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖と反対である)。他の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン)を含む塩基エディターは、編集のために標的化されているDNA分子の鎖を切断することができる。かかる実施形態では、非標的鎖は切断されない。
また、触媒的に不活性な(すなわち、標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターも本明細書に提供される。本明細書において、「触媒的に不活性な(catalytically dead)」および「ヌクレアーゼ不活性型(nuclease dead)」という用語は、核酸の鎖を切断することができないようにする1つ以上の変異および/または欠失を有するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指すように互換的に使用される。一部の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特異的な点変異の結果として、ヌクレアーゼ活性を欠損し得る。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9はD10A変異およびH840A変異の両方を含むことができる。そのような変異は、両方ともヌクレアーゼドメインを不活性化し、それによってヌクレアーゼ活性の喪失をもたらす。他の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1および/またはHNHドメイン)の全部または一部の1つ以上の欠失を含むことができる。さらなる実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)、ならびにヌクレアーゼドメインの全部または一部の欠失を含む。
また、本明細書では、以前の機能的バージョンのポリヌクレオチドプログラマブルヌクレオチド結合ドメインから、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインを生成することができる変異も企図される。例えば、触媒的に不活性なCas9(「dCas9」)の場合、D10AおよびH840A以外の変異を有するバリアントが提供され、これにより、ヌクレアーゼ不活性化Cas9がもたらされる。そのような変異としては、例として、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)が挙げられる。さらなる好適なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野の知識に基づいて、当業者には明らかであり得、本開示の範囲内である。かかる追加の例示的で好適なヌクレアーゼ不活性Cas9ドメインとしては、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A変異体ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al.,CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature Biotechnology.2013;31(9):833-838を参照されたい。その内容全体が、参照により本明細書に援用される)。
塩基エディターに組み込まれ得るポリヌクレオチドプログラマブルヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含み、結合したガイド核酸を介して、核酸のCRISPR(すなわち、クラスター化された規則的な間隔の短い回文反復)媒介性修飾の間に核酸配列に結合することができる天然または修飾されたタンパク質もしくはその一部を含む。かかるタンパク質は、本明細書において「CRISPRタンパク質」と称される。したがって、本明細書において、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディター(すなわち、塩基エディターの「CRISPRタンパク質由来ドメイン」とも称されるCRISPRタンパク質の全部または一部をドメインとして含む塩基エディター)が開示される。塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンと比較して、修飾され得る。例えば、以下に記載されるように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンと比較して、1つ以上の変異、挿入、欠失、再編、および/または組換えを含み得る。
CRISPRは、可動遺伝要素(ウイルス、転位要素、および接合性プラスミド)に対する保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターが転写され、CRISPR RNA(crRNA)に加工される。II型CRISPRシステムでは、crRNA前駆体の正しいプロセシングには、トランスコード化低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、およびCas9タンパク質が必要である。tracrRNAは、crRNA前駆体のリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合およびDNA切断は、典型的には、タンパク質および両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」、または単に「gRNA」)は、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように操作することができる。例えば、Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。Cas9は、CRISPR反復配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己の区別を助ける。
一部の実施形態では、本明細書に記載の方法は、操作されたCasタンパク質を利用することができる。ガイドRNA(gRNA)は、Cas結合に必要な足場配列と、修飾されるゲノム標的を定義するユーザ定義の約20ヌクレオチドのスペーサーとからなる短い合成RNAである。したがって、当業者は、Casタンパク質特異性のゲノム標的を変えることができ、gRNAの標的配列がゲノムの残部と比較して、ゲノム標的に対してどの程度特異的であるかによって部分的に決定される。
一部の実施形態では、gRNA足場配列は、以下のとおりである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU。
一実施形態では、RNA足場は、ステム・ループを含む。一実施形態では、RNA足場は、以下の核酸配列を含む:
GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUG。
一実施形態では、RNA足場は、正準ステム・ループを含む。一実施形態では、RNA足場は、以下の核酸配列を含む:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU
ここで、m=2’-O-メチル修飾、および*=3’ホスホロチオエートヌクレオチド間結合(すなわち、ここに示されるように、第1の3’末端のRNA残基)。
一実施形態では、RNA足場は、以下の核酸配列を含む:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
ここで、m=2’-O-メチル修飾、および*=3’ホスホロチオエートヌクレオチド間結合(すなわち、ここに示されるように、第1の3’末端のRNA残基)。
一実施形態では、S.pyogenes sgRNA足場のポリヌクレオチド配列は、以下のとおりである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC。
一実施形態では、S.aureus sgRNA足場のポリヌクレオチド配列は、以下のとおりである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA。
一実施形態では、BhCas12b sgRNA足場は、以下のポリヌクレオチド配列を有する:
GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCAC。
一実施形態では、BvCas12b sgRNA足場は、以下のポリヌクレオチド配列を有する:GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCAC。
一実施形態では、RNA足場は、非正準配列を含む。一実施形態では、RNA足場は、以下の核酸配列を含む:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCU*mU*mU*mU
ここで、m=2’-O-メチル修飾、および*=3’ホスホロチオエートヌクレオチド間結合(すなわち、ここに示されるように、第1の3’末端のRNA残基)。
一部の実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、エンドヌクレアーゼ(例えば、デオキシリボヌクレアーゼまたはリボヌクレアーゼ)であり、結合したガイド核酸と併せた場合、標的ポリヌクレオチドに結合することができる。一部の実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、ニッカーゼであり、結合したガイド核酸と併せた場合、標的ポリヌクレオチドに結合することができる。一部の実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、触媒的に不活性なドメインであり、結合したガイド核酸と併せた場合、標的ポリヌクレオチドに結合することができる。一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、DNAである。一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、RNAである。
本明細書で使用され得るCasタンパク質としては、クラス1およびクラス2が挙げられる。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦ、CARF、DinG、それらのホモログ、またはそれらの修飾バージョンが挙げられる。未修飾CRISPR酵素は、2つの機能的なエンドヌクレアーゼドメイン(RuvCおよびHNH)を有する、Cas9などのDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列における一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれ以上の塩基対内の一方または両方の鎖の切断を誘導することができる。
変異したCRISPR酵素が、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを使用することができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S.pyogenes由来のCas9)と、少なくとも、または少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指し得る。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S.pyogenes由来)と、最大、または最大約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指し得る。Cas9は、Cas9タンパク質の野生型または修飾形態を指すことができ、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得る。
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans(NCBI参照:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照:NC_021284.1)、Prevotella intermedia(NCBI参照:NC_017861.1)、Spiroplasma taiwanense(NCBI参照:NC_021846.1)、Streptococcus iniae(NCBI参照:NC_021314.1)、Belliella baltica(NCBI参照:NC_018010.1)、Psychroflexus torquis(NCBI参照:NC_018721.1)、Streptococcus thermophilus(NCBI参照:YP_820832.1)、Listeria innocua(NCBI参照:NP_472073.1)、Campylobacter jejuni(NCBI参照:YP_002344900.1)、Neisseria meningitidis(NCBI参照:YP_002342100.1)、Streptococcus pyogenes、またはStaphylococcus aureus由来のCas9の全部または一部を含み得る。
核酸塩基エディターのCas9ドメイン
Cas9ヌクレアーゼ配列および構造は、当業者に周知である(例えば、“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。Cas9オーソログは、これらに限定されないが、S.pyogenesおよびS.thermophilusを含む様々な種で記載されている。さらなる好適なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者には明らかであり、そのようなCas9ヌクレアーゼおよび配列には、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物および遺伝子座に由来するCas9配列が含まれる(その内容全体が、参照により本明細書に援用される)。
一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas9ドメインである。非限定的な例示的なCas9ドメインが本明細書に提供される。Cas9ドメインは、ヌクレアーゼ活性型Cas9ドメイン、ヌクレアーゼ不活性型Cas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)であり得る。一部の実施形態では、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二重鎖核酸の両方の鎖(例えば、二重鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。一部の実施形態では、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つを含む。一部の実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、Cas9の断片を含むタンパク質が提供される。例えば、一部の実施形態では、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1)Cas9のgRNA結合ドメイン、または(2)Cas9のDNA切断ドメイン。一部の実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上のアミノ酸変化を有し得る。一部の実施形態では、Cas9バリアントは、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、そのため、その断片は、野生型Cas9の対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。一部の実施形態では、断片は、少なくとも100アミノ酸長である。一部の実施形態では、断片は、長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
一部の実施形態では、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列(例えば、本明細書に提供されるCas9配列のうちの1つ)を含む。しかしながら、他の実施形態では、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、1つ以上のその断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的なアミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
Cas9タンパク質は、Cas9タンパク質を、ガイドRNAに相補的な特異的DNA配列に誘導するガイドRNAと会合することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、Cas9ドメイン、例えば、ヌクレアーゼ活性型Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性型Cas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の例としては、限定されないが、Cas9(例えば、dCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られている)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの修飾もしくは操作されたバージョンが挙げられる。
一部の実施形態では、野生型Cas9は、Streptococcus pyogenes(NCBI参照配列:NC_017053.1)由来のCas9に対応する。代表的なStreptococcus pyogenes Cas9(spCas9)核酸配列を以下に提供する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
例示的なStreptococcus pyogenes Cas9(spCas9)アミノ酸配列を以下に提供する:
(単一下線:HNHドメイン、二重下線:RuvCドメイン)
一部の実施形態では、野生型Cas9は、以下のヌクレオチド配列に対応するか、またはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
一部の実施形態では、野生型Cas9は、以下のアミノ酸配列に対応するか、またはそれを含む:
(単一下線:HNHドメイン、二重下線:RuvCドメイン)。
一部の実施形態では、野生型Cas9は、Streptococcus pyogenes(NCBI参照配列:NC_002737.2(以下のヌクレオチド配列))由来のCas9に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
一部の実施形態では、野生型Cas9は、Streptococcus pyogenes(Uniprot参照配列:Q99ZW2(以下のアミノ酸配列))由来のCas9に対応する:
(単一下線:HNHドメイン、二重下線:RuvCドメイン)
一部の実施形態では、Cas9は、Corynebacterium ulcerans(NCBI参照:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照:NC_021284.1)、Prevotella intermedia(NCBI参照:NC_017861.1)、Spiroplasma taiwanense(NCBI参照:NC_021846.1)、Streptococcus iniae(NCBI参照:NC_021314.1)、Belliella baltica(NCBI参照:NC_018010.1)、Psychroflexus torquis I(NCBI参照:NC_018721.1)、Streptococcus thermophilus(NCBI参照:YP_820832.1)、Listeria innocua(NCBI参照:NP_472073.1)、Campylobacter jejuni(NCBI参照:YP_002344900.1)またはNeisseria meningitidis(NCBI参照:YP_002342100.1)に由来するCas9、または任意の他の生物由来のCas9を指す。
追加のCas9タンパク質(例えば、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性型Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内であることを理解されたい。例示的なCas9タンパク質としては、以下に提供されるものが挙げられるが、これらに限定されない。一部の実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性型Cas9(dCas9)である。一部の実施形態では、Cas9タンパク質はCas9ニッカーゼ(nCas9)である。一部の実施形態では、Cas9タンパク質は、ヌクレアーゼ活性型Cas9である。
一部の実施形態では、Cas9ドメインは、ヌクレアーゼ不活性型Cas9ドメイン(dCas9)である。例えば、dCas9ドメインは、二重鎖核酸分子のいずれかの鎖を切断することなく、二重鎖核酸分子に結合することができる(例えば、gRNA分子を介して)。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載されるアミノ酸配列のD10X変異およびH840X変異(ここで、Xは、任意のアミノ酸変化である)を含むか、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異を含む。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載されるアミノ酸配列のD10A変異およびH840A変異を含むか、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(受託番号BAV54124)に記載されるアミノ酸配列を含む。
例示的な触媒不活性Cas9(dCas9)のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(例えば、Qi et al.,“Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.”Cell.2013;152(5):1173-83を参照されたい。その内容全体が、参照により本明細書に援用される)。
さらなる好適なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。かかる追加の例示的で好適なヌクレアーゼ不活性Cas9ドメインとしては、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A変異体ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al.,CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature Biotechnology.2013;31(9):833-838を参照されたい。その内容全体が、参照により本明細書に援用される)。
一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、(「ニッカーゼ」Cas9の場合)Cas9は、ニッカーゼであり、「nCas9」タンパク質と称される。ヌクレアーゼ不活性化Cas9タンパク質は、互換的に、「dCas9」タンパク質(ヌクレアーゼ-「不活性型(dead)」Cas9の場合)または触媒不活性Cas9と称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成するための方法は既知である。例えば、Jinek et al.,Science.337:816-821(2012)、Qi et al.,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013)Cell.28;152(5):1173-83を参照されたい(それらの各々の内容全体が、参照により本明細書に援用される)。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン(HNHヌクレアーゼサブドメインおよびRuvC1サブドメイン)を含むことが知られている。HNHサブドメインは、gRNAに相補的な鎖を切断し、一方、RuvC1サブドメインは、非相補的な鎖を切断する。これらのサブドメイン内の変異は、Cas9のヌクレアーゼ活性をサイレンシングすることができる。例えば、変異D10AおよびH840Aは、S.pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。
一部の実施形態では、dCas9ドメインは、本明細書に提供されるdCas9ドメインのいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に、部分的もしくは全体的に対応するか、またはそれを含む。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載されるアミノ酸配列のD10X変異およびH840X変異(ここで、Xは、任意のアミノ酸変化である)を含むか、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異を含む。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載されるアミノ酸配列のD10A変異およびH840A変異を含むか、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(受託番号BAV54124)に示されるアミノ酸配列を含む。
一部の実施形態では、dCas9は、以下のdCas9(D10AおよびH840A)のアミノ酸配列を含む:
(単一下線:HNHドメイン、二重下線:RuvCドメイン)。
一部の実施形態では、例示的な触媒不活性Cas9(dCas9)のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えば、Qi et al.,“Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.”Cell.2013;152(5):1173-83を参照されたい。その内容全体が、参照により本明細書に援用される)。
一部の実施形態では、例示的な触媒不活性Cas9(dCas9)のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
一部の実施形態では、Cas9ドメインは、D10A変異を含み、一方、位置840の残基は、上に提供されるアミノ酸配列において、または本明細書に提供される任意のアミノ酸配列における対応する位置において、ヒスチジンのままである。
他の実施形態では、例えば、ヌクレアーゼ不活性型Cas9(dCas9)をもたらす、D10AおよびH840A以外の変異を有するdCas9バリアントが提供される。そのような変異としては、例として、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)が挙げられる。一部の実施形態では、dCas9のバリアントまたはホモログは、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、dCas9のバリアントは、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸以上より短いまたはより長いアミノ酸配列を有する。
さらなる好適なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。かかる追加の例示的で好適なヌクレアーゼ不活性Cas9ドメインとしては、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A変異体ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al.,CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature Biotechnology.2013;31(9):833-838を参照されたい。その内容全体が、参照により本明細書に援用される)。
一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、(「ニッカーゼ」Cas9の場合)Cas9は、ニッカーゼであり、「nCas9」タンパク質と称される。Cas9ニッカーゼは、二重鎖核酸分子(例えば、二重鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の標的鎖を切断し、つまり、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対を形成している(相補的な)鎖を切断する。一部の実施形態では、Cas9ニッカーゼは、D10A変異を含み、位置840にヒスチジンを有する。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の非標的の未塩基編集鎖を切断し、つまり、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対を形成していない鎖を切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、H840A変異を含み、位置10にアスパラギン酸残基、または対応する変異を有する。一部の実施形態では、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。さらなる好適なCas9ニッカーゼは、本開示および当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。
例示的な触媒的Cas9ニッカーゼ(nCas9)のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
一部の実施形態では、Cas9は、単細胞性原核微生物のドメインおよび界を構成する古細菌(例えば、ナノ古細菌)由来のCas9を指す。一部の実施形態では、核酸プログラマブルDNA結合タンパク質は、CasXまたはCasYタンパク質であってもよく、それらは、例えば、Burstein et al.,“New CRISPR-Cas systems from uncultivated microbes.”Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されている(その内容全体が、参照により本明細書に援用される)。ゲノム解像メタゲノミクスを使用して、いくつかのCRISPR-Casシステムが同定されており、生命の古細菌ドメインで最初に報告されたCas9が含まれる。この多岐にわたるCas9タンパク質は、活性なCRISPR-Casシステムの一部として、ほとんど研究されていなかったナノ古細菌において見出された。細菌では、これまでに知られていなかった2つの系、CRISPR-CasXおよびCRISPR-CasYが発見されたが、これらは、これまでに発見された中で最もコンパクトなシステムのうちの1つである。一部の実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9は、CasX、またはCasXのバリアントによって置き換えられる。一部の実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9は、CasY、またはCasYのバリアントによって置き換えられる。他のRNAガイドDNA結合タンパク質が、核酸プログラマブルDNA結合タンパク質(napDNAbp)として使用されてもよく、それらが本開示の範囲内であることを理解されたい。
一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、CasXまたはCasYタンパク質であり得る。一部の実施形態では、napDNAbpは、CasXタンパク質である。一部の実施形態では、napDNAbpは、CasYタンパク質である。一部の実施形態では、プログラマブルヌクレオチド結合タンパク質は、本明細書に記載の任意のCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含む。一部の実施形態では、プログラマブルヌクレオチド結合タンパク質は、天然に存在するCasXまたはCasYタンパク質である。一部の実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本開示に従って、他の細菌種由来のCasXおよびCasYも使用され得ることを理解されたい。
例示的なCasX((uniprot.org/uniprot/F0NN87;uniprot.org/uniprot/F0NH53)tr|F0NN87|F0NN87_SULIHCRISPR-associatedCasxタンパク質 OS=Sulfolobus islandicus(HVE10/4株)GN=SiH_0402 PE=4 SV=1)のアミノ酸配列は、以下のとおりである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.
例示的なCasX(>tr|F0NH53|F0NH53_SULIR CRISPR関連タンパク質、Casx OS=Sulfolobus islandicus(REY15A株)GN=SiRe_0771 PE=4 SV=1)のアミノ酸配列は、以下のとおりである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.
デルタプロテオバクテリアCasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY((ncbi.nlm.nih.gov/protein/APG80656.1)>APG80656.1 CRISPR関連タンパク質CasY[難培養パルクバクテリア群の細菌])のアミノ酸配列は、以下のとおりである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI.
Cas9ヌクレアーゼは、2つの機能的なエンドヌクレアーゼドメイン(RuvCおよびHNH)を有する。Cas9は、標的結合時にコンフォメーション変化を起こし、ヌクレアーゼドメインを標的DNAの反対側の鎖を切断するように位置付ける。Cas9媒介性DNA切断の最終結果は、標的DNA内の二本鎖切断(DSB)である(PAM配列の約3~4ヌクレオチド上流)。次いで、得られたDSBは、以下の2つの一般的な修復経路のうちの1つによって修復される:(1)効率的だがエラーを起こしやすい非相同末端結合(NHEJ)経路、または(2)効率は低いが忠実度が高い相同組換え修復(HDR)経路。
非相同末端結合(NHEJ)および/または相同組換え修復(HDR)の「効率」は、任意の好都合な方法によって計算することができる。例えば、一部の実施形態では、効率は、成功したHDRのパーセンテージで表すことができる。例えば、サーベイヤーヌクレアーゼアッセイを使用して切断生成物を生成することができ、生成物と基質との比を使用してパーセンテージを計算することができる。例えば、サーベイヤーヌクレアーゼ酵素を使用して、HDRの成功で得られる新たに組み込まれた制限配列を含むDNAを、直接切断することができる。より多くの基質の切断は、より高いパーセントのHDRを示す(より高い効率のHDR)。例示的な例として、HDRの割合(パーセンテージ)は、以下の式[(切断生成物)/(基質+切断生成物)]を使用して計算することができる(例えば、(b+c)/(a+b+c)。式中、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物のバンド強度である)。
一部の実施形態では、効率は、成功したNHEJのパーセンテージで表し得る。例えば、T7エンドヌクレアーゼIアッセイを使用して、切断生成物を生成することができ、生成物と基質との比を使用して、NHEJの割合を計算することができる。T7エンドヌクレアーゼIは、野生型および変異型DNA鎖のハイブリダイゼーションから生じる不一致のヘテロ二重鎖DNAを切断する(NHEJは、元の切断部位で小さなランダムな挿入または欠失(インデル)を生成する)。より多くの切断は、より高いパーセントのNHEJ(より高い効率のNHEJ)を示す。例示的な例として、NHEJの割合(パーセンテージ)を、以下の式を使用して計算することができる:(1-(1-(b+c)/(a+b+c))1/2)×100(式中、「a」は、DNA基質のバンド強度であり、「b」および「c」は、切断生成物のバンド強度である)(Ran et.al.,Cell.2013 Sep.12;154(6):1380-9;and Ran et al.,Nat Protoc.2013 Nov.;8(11):2281-2308)。
NHEJ修復経路は、最も活性な修復機構であり、DSB部位において小さなヌクレオチドの挿入または欠失(インデル)を頻繁に引き起こす。Cas9およびgRNA、またはガイドポリヌクレオチドを発現する細胞集団は、多様な変異をもたらし得るため、NHEJ媒介性DSB修復のランダム性は、重要な実用的な意味を有する。ほとんどの実施形態では、NHEJは、標的DNA内に小さなインデルを生じさせ、標的遺伝子のオープンリーディングフレーム(ORF)内の未熟終止コドンにつながるアミノ酸の欠失、挿入、またはフレームシフト変異をもたらす。理想的な最終結果は、標的遺伝子内の機能喪失変異である。
NHEJ媒介性DSB修復は、しばしば遺伝子のオープンリーディングフレームを破壊するが、相同組換え修復(HDR)を使用して、単一のヌクレオチド変化から大きな挿入(例えば、フルオロフォアまたはタグの添加)までの範囲の特定のヌクレオチド変化を生成することができる。
HDRを遺伝子編集に利用するために、所望の配列を含むDNA修復鋳型を、gRNAおよびCas9またはCas9ニッカーゼを用いて目的の細胞型に送達することができる。修復鋳型は、所望の編集、ならびに標的のすぐ上流および下流の追加の相同配列(左相同性アームおよび右相同性アームと称される)を含むことができる。各相同性アームの長さは、導入される変化のサイズに依存し得、より大きな挿入は、より長い相同性アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであってもよい。Cas9、gRNA、および外因性修復鋳型を発現する細胞でさえ、HDRの効率は概して低い(修飾アレルの10%未満)。HDRは、細胞周期のS期およびG2期の間に行われるため、HDRの効率は、細胞を同期させることによって増強され得る。NHEJに関与する遺伝子を化学的または遺伝的に阻害することで、HDR頻度を増加させることもできる。
一部の実施形態では、Cas9は、修飾Cas9である。所与のgRNA標的配列は、部分的な相同性が存在するゲノム全体にわたって追加の部位を有することができる。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNA設計を最適化することに加えて、Cas9への修飾を通して、CRISPRの特異性を増加させることもできる。Cas9は、2つのヌクレアーゼドメイン(RuvCおよびHNH)の複合活性を介して二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。ニッカーゼシステムは、特定の遺伝子編集のためのHDR媒介性遺伝子編集と組み合わせることもできる。
一部の実施形態では、Cas9は、バリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較した場合、1つのアミノ酸が異なるアミノ酸配列を有する(例えば、欠失、挿入、置換、融合を有する)。場合によっては、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、場合によっては、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満のヌクレアーゼ活性を有する。一部の実施形態では、バリアントCas9タンパク質は、実質的なヌクレアーゼ活性を有しない。対象のCas9タンパク質が、実質的なヌクレアーゼ活性を有しないバリアントCas9タンパク質である場合、「dCas9」と称され得る。
一部の実施形態では、バリアントCas9タンパク質は、減少したヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質(例えば、野生型Cas9タンパク質)の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満のエンドヌクレアーゼ活性を示す。
一部の実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸位置10のアスパラギン酸がアラニン)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断する際、二本鎖切断(DSB)の代わりに一本鎖切断(SSB)をもたらす)(例えば、Jinek et al.,Science.2012 Aug.17;337(6096):816-21を参照されたい)。
一部の実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメインの機能を低下させる変異(アミノ酸置換)を有し得る(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸位置840のヒスチジンがアラニン)を有し、したがって、ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断する際、DSBの代わりにSSBをもたらす)。かかるCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力を保持する。
一部の実施形態では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10AおよびH840A変異の両方を有し、そのため、ポリペプチドが二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、W476AおよびW1126A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、W476A、およびW1126A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9は、Cas9HNHドメイン(A840H)の位置840で触媒His残基を回復した。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、一部のかかる実施形態では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、PAM配列を必要としない。言い換えると、一部の実施形態では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、ガイドRNAを含み得るが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的化セグメントによって提供される)。他の残基を変異させて、上記の効果を達成することができる(すなわち、一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。
一部の実施形態では、触媒活性が低下したバリアントCas9タンパク質(例えば、Cas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987変異(例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986A)を有する場合)、バリアントCas9タンパク質は、それがガイドRNAと相互作用する能力を保持する限り、依然として部位特異的な様式で標的DNAに結合することができる(依然としてガイドRNAによって標的DNA配列に誘導されるため)。
一部の実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
一部の実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(SpCas9-MQKFRAER)を含み、かつ改変されたPAM 5’-NGC-3’に対して特異性を有する修飾SpCas9が使用された。
S.pyogenes Cas9の代替物としては、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNAガイドエンドヌクレアーゼを挙げることができる。PrevotellaおよびFrancisella1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスIIのCRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この後天性免疫機構は、Prevotella菌およびFrancisella菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座と関連付けられ、ガイドRNAを使用してウイルスDNAを発見および切断するエンドヌクレアーゼをコードしている。Cpf1は、Cas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムのいくつかの制約を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断は、短い3’オーバーハングを有する二本鎖切断をもたらす。Cpf1の互い違い(staggered)の切断パターンは、従来の制限酵素によるクローニングに類似した定方向遺伝子導入の可能性を開き、遺伝子編集の効率を高めることができる。上に記載のCas9バリアントおよびオーソログと同様に、Cpf1はまた、CRISPRによって標的化され得る部位の数を、SpCas9に適したNGG PAM部位を欠くATリッチ領域またはATリッチゲノムまで拡張することができる。Cpf1遺伝子座は、混合されたα/βドメイン、RuvC-I、続いてヘリカル領域、RuvC-II、およびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。
さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のαヘリカル認識ローブを有しない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的に固有であり、クラス2のV型CRISPRシステムとして分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型およびIII型システムに類似したCas1、Cas2、およびCas4タンパク質をコードする。機能的なCpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9の約半分のヌクレオチド数)を有するため、ゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的化されるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ(5’-YTN-3’または5’-TTN-3’)を識別することによって、標的DNAまたはRNAを切断する。PAMの識別後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する粘着末端様のDNA二本鎖切断を導入する。
一部の実施形態では、Cas9は、改変PAM配列に対する特異性を有するCas9バリアントである。一部の実施形態では、追加のCas9バリアントおよびPAM配列は、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)に記載されている(その全体が、参照により本明細書に援用される)。一部の実施形態では、Cas9バリアントは、特定のPAM要件を有しない。一部の実施形態では、Cas9バリアント(例えば、SpCas9バリアント)は、NRNH PAMに対する特異性を有する(ここで、Rは、AまたはGであり、Hは、A、C、またはTである)。一部の実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。一部の実施形態では、SpCas9バリアントは、位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349、またはそれらの対応する位置に、アミノ酸置換を含む。表3A~3Dに、SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性を示す。



一部の実施形態では、Cas9は、Neisseria meningitidis Cas9(NmeCas9)またはそのバリアントである。一部の実施形態では、NmeCas9は、NNNNGAYW PAMに対する特異性を有する(ここで、Yは、CまたはTであり、Wは、AまたはTである)。一部の実施形態では、NmeCas9は、NNNNGYTT PAMに対する特異性を有する(ここで、Yは、CまたはTである)。一部の実施形態では、NmeCas9は、NNNNGTCT PAMに対する特異性を有する。一部の実施形態では、NmeCas9はNme1Cas9である。一部の実施形態では、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。一部の実施形態では、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対する特異性を有する。一部の実施形態では、NmeCas9は、CAA PAM、CAAA PAM、またはCCA PAMに対する特異性を有する。一部の実施形態では、NmeCas9は、Nme2Cas9である。一部の実施形態では、NmeCas9は、NNNNCC(N4CC)PAMに対する特異性を有する(ここで、Nは、A、G、C、またはTのいずれか1つである)。一部の実施形態では、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。一部の実施形態では、NmeCas9は、Nme3Cas9である。一部の実施形態では、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対する特異性を有する。Edraki et al.Mol.Cell.(2019)73(4):714-726に記載されている追加のNmeCas9の特徴およびPAM配列は、その全体が参照により本明細書に援用される。
例示的なNeisseria meningitidis Cas9タンパク質であるNme1Cas9(NCBI参照:WP_002235162.1;II型CRISPR RNAガイドエンドヌクレアーゼCas9)は、以下のアミノ酸配列を有する:
1 MAAFKPNPIN YILGLDIGIA SVGWAMVEID EDENPICLID LGVRVFERAE VPKTGDSLAM
61 ARRLARSVRR LTRRRAHRLL RARRLLKREG VLQAADFDEN GLIKSLPNTP WQLRAAALDR
121 KLTPLEWSAV LLHLIKHRGY LSQRKNEGET ADKELGALLK GVADNAHALQ TGDFRTPAEL
181 ALNKFEKESG HIRNQRGDYS HTFSRKDLQA ELILLFEKQK EFGNPHVSGG LKEGIETLLM
241 TQRPALSGDA VQKMLGHCTF EPAEPKAAKN TYTAERFIWL TKLNNLRILE QGSERPLTDT
301 ERATLMDEPY RKSKLTYAQA RKLLGLEDTA FFKGLRYGKD NAEASTLMEM KAYHAISRAL
361 EKEGLKDKKS PLNLSPELQD EIGTAFSLFK TDEDITGRLK DRIQPEILEA LLKHISFDKF
421 VQISLKALRR IVPLMEQGKR YDEACAEIYG DHYGKKNTEE KIYLPPIPAD EIRNPVVLRA
481 LSQARKVING VVRRYGSPAR IHIETAREVG KSFKDRKEIE KRQEENRKDR EKAAAKFREY
541 FPNFVGEPKS KDILKLRLYE QQHGKCLYSG KEINLGRLNE KGYVEIDHAL PFSRTWDDSF
601 NNKVLVLGSE NQNKGNQTPY EYFNGKDNSR EWQEFKARVE TSRFPRSKKQ RILLQKFDED
661 GFKERNLNDT RYVNRFLCQF VADRMRLTGK GKKRVFASNG QITNLLRGFW GLRKVRAEND
721 RHHALDAVVV ACSTVAMQQK ITRFVRYKEM NAFDGKTIDK ETGEVLHQKT HFPQPWEFFA
781 QEVMIRVFGK PDGKPEFEEA DTPEKLRTLL AEKLSSRPEA VHEYVTPLFV SRAPNRKMSG
841 QGHMETVKSA KRLDEGVSVL RVPLTQLKLK DLEKMVNRER EPKLYEALKA RLEAHKDDPA
901 KAFAEPFYKY DKAGNRTQQV KAVRVEQVQK TGVWVRNHNG IADNATMVRV DVFEKGDKYY
961 LVPIYSWQVA KGILPDRAVV QGKDEEDWQL IDDSFNFKFS LHPNDLVEVI TKKARMFGYF
1021 ASCHRGTGNI NIRIHDLDHK IGKNGILEGI GVKTALSFQK YQIDELGKEI RPCRLKKRPP
1081 VR
例示的なNeisseria meningitidis Cas9タンパク質であるNme2Cas9(NCBI参照:WP_002230835;II型CRISPR RNAガイドエンドヌクレアーゼCas9)は、以下のアミノ酸配列を有する:
1 MAAFKPNPIN YILGLDIGIA SVGWAMVEID EEENPIRLID LGVRVFERAE VPKTGDSLAM
61 ARRLARSVRR LTRRRAHRLL RARRLLKREG VLQAADFDEN GLIKSLPNTP WQLRAAALDR
121 KLTPLEWSAV LLHLIKHRGY LSQRKNEGET ADKELGALLK GVANNAHALQ TGDFRTPAEL
181 ALNKFEKESG HIRNQRGDYS HTFSRKDLQA ELILLFEKQK EFGNPHVSGG LKEGIETLLM
241 TQRPALSGDA VQKMLGHCTF EPAEPKAAKN TYTAERFIWL TKLNNLRILE QGSERPLTDT
301 ERATLMDEPY RKSKLTYAQA RKLLGLEDTA FFKGLRYGKD NAEASTLMEM KAYHAISRAL
361 EKEGLKDKKS PLNLSSELQD EIGTAFSLFK TDEDITGRLK DRVQPEILEA LLKHISFDKF
421 VQISLKALRR IVPLMEQGKR YDEACAEIYG DHYGKKNTEE KIYLPPIPAD EIRNPVVLRA
481 LSQARKVING VVRRYGSPAR IHIETAREVG KSFKDRKEIE KRQEENRKDR EKAAAKFREY
541 FPNFVGEPKS KDILKLRLYE QQHGKCLYSG KEINLVRLNE KGYVEIDHAL PFSRTWDDSF
601 NNKVLVLGSE NQNKGNQTPY EYFNGKDNSR EWQEFKARVE TSRFPRSKKQ RILLQKFDED
661 GFKECNLNDT RYVNRFLCQF VADHILLTGK GKRRVFASNG QITNLLRGFW GLRKVRAEND
721 RHHALDAVVV ACSTVAMQQK ITRFVRYKEM NAFDGKTIDK ETGKVLHQKT HFPQPWEFFA
781 QEVMIRVFGK PDGKPEFEEA DTPEKLRTLL AEKLSSRPEA VHEYVTPLFV SRAPNRKMSG
841 AHKDTLRSAK RFVKHNEKIS VKRVWLTEIK LADLENMVNY KNGREIELYE ALKARLEAYG
901 GNAKQAFDPK DNPFYKKGGQ LVKAVRVEKT QESGVLLNKK NAYTIADNGD MVRVDVFCKV
961 DKKGKNQYFI VPIYAWQVAE NILPDIDCKG YRIDDSYTFC FSLHKYDLIA FQKDEKSKVE
1021 FAYYINCDSS NGRFYLAWHD KGSKEQQFRI STQNLVLIQK YQVNELGKEI RPCRLKKRPP
1081 VR
核酸塩基エディターのCas12ドメイン
典型的には、微生物CRISPR-Casシステムは、クラス1およびクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有し、クラス2システムは、単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1は、異なるタイプであるが、クラス2エフェクターである(それぞれ、II型およびV型)。Cpf1、クラス2に加えて、V型CRISPR-Casシステムはまた、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦを含む)。例えば、Shmakov et al.,“Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,”Mol.Cell,2015 Nov.5;60(3):385-397;Makarova et al.,“Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?”CRISPR Journal,2018,1(5):325-336;and Yan et al.,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91を参照されたい(各々の内容全体が、参照により本明細書に援用される)。V型Casタンパク質は、RuvC(または、RuvC様)エンドヌクレアーゼドメインを含む。成熟CRISPR RNA(crRNA)の産生は、概して、tracrRNA非依存性であるが、例えば、Cas12b/C2c1は、crRNAの産生にtracrRNAを必要とする。Cas12b/C2c1は、DNA切断について、crRNAおよびtracrRNAの両方に依存する。
本発明で企図される核酸プログラマブルDNA結合タンパク質は、クラス2、V型(Cas12タンパク質)に分類されるCasタンパク質を含む。Casクラス2、V型タンパク質の非限定的な例としては、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦそのホモログ、またはそれらの修飾バージョンが挙げられる。本明細書で使用される場合、Cas12タンパク質は、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインとも称され得る。一部の実施形態では、本発明のCas12タンパク質は、デアミナーゼドメインなどの内部融合タンパク質ドメインによって中断されたアミノ酸配列を含む。
一部の実施形態では、Cas12ドメインは、ヌクレアーゼ不活性Cas12ドメインまたはCas12ニッカーゼである。一部の実施形態では、Cas12ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二重鎖核酸(例えば、二重鎖DNA分子)の一方の鎖をニックするCas12ドメインであってもよい。一部の実施形態では、Cas12ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つを含む。一部の実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、Cas12の断片を含むタンパク質が提供される。例えば、一部の実施形態では、タンパク質は、以下の2つのCas12ドメインのうちの1つを含む:(1)Cas12のgRNA結合ドメイン、または(2)Cas12のDNA切断ドメイン。一部の実施形態では、Cas12またはその断片を含むタンパク質は、「Cas12バリアント」と称される。Cas12バリアントは、Cas12またはその断片と相同性を共有する。例えば、Cas12バリアントは、野生型Cas12と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas12バリアントは、野生型Cas12と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上のアミノ酸変化を有し得る。一部の実施形態では、Cas12バリアントは、Cas12の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、そのため、その断片は、野生型Cas12の対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、断片は、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。一部の実施形態では、断片は、少なくとも100アミノ酸長である。一部の実施形態では、断片は、長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
一部の実施形態では、Cas12は、Cas12ヌクレアーゼ活性を改変する1つ以上の変異を有するCas12アミノ酸配列に、部分的もしくは全体的に対応するか、またはそれを含む。そのような変異としては、例えば、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が挙げられる。一部の実施形態では、Cas12のバリアントまたはホモログは、野生型Cas12と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas12のバリアントは、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸以上より短いまたはより長いアミノ酸配列を有する。
一部の実施形態では、本明細書に提供されるCas12融合タンパク質は、Cas12タンパク質の全長アミノ酸配列(例えば、本明細書に提供されるCas12配列のうちの1つ)を含む。しかしながら、他の実施形態では、本明細書に提供される融合タンパク質は、全長Cas12配列を含まず、1つ以上のその断片のみを含む。好適なCas12ドメインの例示的なアミノ酸配列が本明細書に提供され、Cas12ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
一般に、クラス2、V型Casタンパク質は、単一の機能的なRuvCエンドヌクレアーゼドメインを有する(例えば、Chen et al.,“CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,”Science 360:436-439(2018)を参照されたい)。場合によっては、Cas12タンパク質は、バリアントCas12bタンパク質である(Strecker et al.,Nature Communications,2019,10(1):Art.No.:212を参照されたい)。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した場合、1、2、3、4、5個、またはそれ以上のアミノ酸が異なるアミノ酸配列を有する(例えば、欠失、挿入、置換、融合を有する)。場合によっては、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、場合によっては、バリアントCas12は、Cas12bポリペプチドであり、対応する野生型Cas12bタンパク質の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満のニッカーゼ活性を有する。場合によっては、バリアントCas12bタンパク質は、実質的なニッカーゼ活性を有しない。
場合によっては、バリアントCas12bタンパク質は、ニッカーゼ活性を低下させる。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満のニッカーゼ活性を示す。
一部の実施形態では、Cas12タンパク質は、哺乳動物細胞において活性を示すCas12a/Cpf1ファミリー由来のRNAガイドエンドヌクレアーゼを含む。PrevotellaおよびFrancisella1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスIIのCRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この後天性免疫機構は、Prevotella菌およびFrancisella菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座と関連付けられ、ガイドRNAを使用してウイルスDNAを発見および切断するエンドヌクレアーゼをコードしている。Cpf1は、Cas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムのいくつかの制約を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断は、短い3’オーバーハングを有する二本鎖切断をもたらす。Cpf1の互い違い(staggered)の切断パターンは、従来の制限酵素によるクローニングに類似した定方向遺伝子導入の可能性を開き、遺伝子編集の効率を高めることができる。上に記載のCas9バリアントおよびオーソログと同様に、Cpf1はまた、CRISPRによって標的化され得る部位の数を、SpCas9に適したNGG PAM部位を欠くATリッチ領域またはATリッチゲノムまで拡張することができる。Cpf1遺伝子座は、混合されたα/βドメイン、RuvC-I、続いてヘリカル領域、RuvC-II、およびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のαヘリカル認識ローブを有しない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的に固有であり、クラス2のV型CRISPRシステムとして分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型およびIII型システムに類似したCas1、Cas2、およびCas4タンパク質をコードする。機能的なCpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9の約半分のヌクレオチド数)を有するため、ゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的化されるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ(5’-YTN-3’または5’-TTTN-3’)を識別することによって、標的DNAまたはRNAを切断する。PAMの識別後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する粘着末端様のDNA二本鎖切断を導入する。
本発明の一部の態様では、ベクターは、変異したCRISPR酵素が標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを使用することができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えば、Bacillus hisashii由来のCas12)と、少なくとも、または少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指し得る。Cas12は、野生型の例示的なCas12ポリペプチド(例えば、Bacillus hisashii(BhCas12b)、Bacillus種V3-13(BvCas12b)、およびAlicyclobacillus acidiphilus(AaCas12b))と、最大、または最大約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指し得る。Cas12は、Cas12タンパク質の野生型または修飾形態を指すことができ、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得る。
一部の実施形態では、BhCas12bガイドポリヌクレオチドは、以下の配列を有する:
BhCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nで示される)
5’GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCACNNNNNNNNNNNNNNNNNNNN-3’
一部の実施形態では、BvCas12bおよびAaCas12bのガイドポリヌクレオチドは、以下の配列を有する。
BvCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nで示される)
5’GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCACNNNNNNNNNNNNNNNNNNNN-3’
AaCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nで示される)
5’GUCUAAAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAACUUCUCAAAAAGAACGAUCUGAGAAGUGGCACNNNNNNNNNNNNNNNNNNNN-3’
核酸プログラマブルDNA結合タンパク質
本開示の一部の態様は、核酸プログラマブルDNA結合タンパク質として機能するドメインを含む融合タンパク質を提供し、これは、タンパク質(例えば、塩基エディター)を特定の核酸(例えば、DNAまたはRNA)配列に誘導するために使用され得る。特定の実施形態では、融合タンパク質は、核酸プログラマブルDNA結合タンパク質ドメインおよびデアミナーゼドメインを含む。核酸プログラマブルDNA結合タンパク質の非限定的な例としては、Cas9(例えば、dCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、およびCas12j/CasΦが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られている)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの修飾もしくは操作されたバージョンが挙げられる。他の核酸プログラマブルDNA結合タンパク質もまた、本開示の範囲内であるが、それらは本開示に具体的に列挙されていない場合がある。例えば、Makarova et al.“Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?”CRISPR J.2018 Oct;1:325-336.doi:10.1089/crispr.2018.0033、Yan et al.,“Functionally diverse type V CRISPR-Cas systems”Science.2019 Jan 4;363(6422):88-91.doi:10.1126/science.aav7271を参照されたい(各々の内容全体が、参照により本明細書に援用される)。
Cas9とは異なるPAM特異性を有する核酸プログラマブルDNA結合タンパク質の一例は、PrevotellaおよびFrancisella1(Cpf1)由来のクラスター化された規則的な間隔の短い回文反復である。Cas9と同様に、Cpf1もクラス2のCRISPRエフェクターである。Cpf1は、Cas9とは異なる特徴に対する強力なDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠く単一のRNAガイドエンドヌクレアーゼであり、Tリッチプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する。16個のCpf1ファミリータンパク質のうち、AcidaminococcusおよびLachnospiraceae由来の2つの酵素は、ヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は、当該技術分野で既知であり、例えば、Yamano et al.,“Crystal structure of Cpf1 in complex with guide RNA and target DNA.”Cell(165)2016,p.949-962に以前に記載されている(その内容全体が、参照により本明細書に援用される)。
本組成物および本方法において、ガイドヌクレオチド配列プログラマブルDNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1(dCpf1)バリアントが有用である。Cpf1タンパク質は、RuvC様エンドヌクレアーゼドメインを有し、これは、Cas9のRuvCドメインに類似しているが、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端が、Cas9のαヘリカル認識ローブを有しない。Zetsche et al.,Cell,163,759-771,2015(参照により本明細書に援用される)では、Cpf1のRuvC様ドメインが、DNA鎖の切断を担い、RuvC様ドメインの不活性化が、Cpf1ヌクレアーゼ活性を不活性化することが示されている例えば、Francisella novicida Cpf1におけるD917A、E1006A、またはD1255Aに対応する変異は、Cpf1ヌクレアーゼ活性を不活性化する。一部の実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。本開示に従って、Cpf1のRuvCドメインを不活性化する任意の変異(例えば、置換変異、欠失、または挿入)が使用され得ることを理解されたい。
一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cpf1タンパク質であり得る。一部の実施形態では、Cpf1タンパク質はCpf1ニッカーゼ(nCpf1)である。一部の実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1(dCpf1)である。一部の実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されるCpf1配列と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、dCpf1は、本明細書に開示されるCpf1配列と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。本開示に従って、他の細菌種由来のCpf1も使用され得ることを理解されたい。
野生型Francisella novicida Cpf1(D917、E1006、およびD1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A(A917、E1006、およびD1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 E1006A(D917、A1006、およびD1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D1255A(D917、E1006、およびA1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/E1006A(A917、A1006、およびD1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/D1255A(A917、E1006、およびA1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 E1006A/D1255A(D917、A1006、およびA1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/E1006A/D1255A(A917、A1006、およびA1255が、太字および下線で示されている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
一部の実施形態では、融合タンパク質に存在するCas9ドメインのうちの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラマブルDNA結合タンパク質ドメインで置き換えられ得る。
一部の実施形態では、Cas9ドメインは、Staphylococcus aureus(SaCas9)由来のCas9ドメインである。一部の実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。一部の実施形態では、SaCas9は、本明細書に提供されるアミノ酸配列のうちのいずれかにおけるN579A変異、または対応する変異を含む。
一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメインは、E781X、N967X、およびR1014X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SaCas9ドメインは、E781K、N967K、またはR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
上記の残基N579を、(例えば、A579に)変異させて、SaCas9ニッカーゼを得ることができる(下線および太字で示されている)。
例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
上記の残基A579を、N579から変異させて、SaCas9ニッカーゼを得ることができる(下線および太字で示されている)。
代表的なSaKKH Cas9
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
上記の残基A579を、N579から変異させて、SaCas9ニッカーゼを得ることができる(下線および太字で示されている)。上記の残基K781、K967、およびH1014を、E781、N967、およびR1014から変異させて、SaKKH Cas9を得ることができる(下線および太字で示されている)。
一部の実施形態では、napDNAbpは、円順列変異体である。以下の配列において、平文(plain text)は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分(bipartite)核局在化配列を示し、二重下線の配列は、変異を示す。アスタリスク(*)は、終止コドン(STOP codon)を示す。
CP5(MSPを含む「NGC=変異を有するPamバリアントのレギュラーCas9様NGG」PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼ):
一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)は、微生物CRISPR-Casシステムの単一エフェクターである。微生物CRISPR-Casシステムの単一のエフェクターとしては、限定されないが、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3が挙げられる。典型的には、微生物CRISPR-Casシステムは、クラス1およびクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有し、クラス2システムは、単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1は、クラス2エフェクターである。Cas9およびCpf1に加えて、3つの異なるクラス2CRISPR-Casシステム(Cas12b/C2c1、およびCas12c/C2c3)が、Shmakov et al.,“Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”,Mol.Cell,2015 Nov.5;60(3):385-397に記載されている(その内容全体が、参照により本明細書に援用される)。システムのうちの2つのエフェクター(Cas12b/C2c1およびCas12c/C2c3)は、Cpf1に関連するRuvC様エンドヌクレアーゼドメインを含む。第3のシステムは、2つの所定のHEPN RNaseドメインを有するエフェクターを含む。成熟CRISPR RNAの産生は、Cas12b/C2c1によるCRISPR RNAの産生とは異なり、tracrRNA非依存性である。Cas12b/C2c1は、DNA切断のためのCRISPR RNAおよびtracrRNAの両方に依存する。
Alicyclobaccillus acidoterrastris Cas12b/C2c1(AacC2c1)の結晶構造は、キメラ単一分子ガイドRNA(sgRNA)との複合体で報告されている。例えば、Liu et al.,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017 Jan.19;65(2):310-322を参照されたい(その内容全体が、参照により本明細書に援用される)。三元複合体としての標的DNAに結合したAlicyclobacillus acidoterrestris C2c1にも結晶構造が報告されている。例えば、Yang et al.,“PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec.15;167(7):1814-1828を参照されたい(その内容全体が、参照により本明細書に援用される)。標的DNA鎖および非標的DNA鎖の両方を有するAacC2c1の触媒能のあるコンフォメーションが捉えられており、これらは、単一のRuvC触媒ポケット内に独立して配置され、Cas12b/C2c1媒介性切断により標的DNAの互い違いの7ヌクレオチド切断をもたらす。Cas12b/C2c1の三元複合体と、以前に特定されたCas9およびCpf1対応物との構造比較は、CRISPR-Cas9システムによって使用されるメカニズムの多様性を実証する。
一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。一部の実施形態では、napDNAbpは、Cas12b/C2c1タンパク質である。一部の実施形態では、napDNAbpは、Cas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、本明細書に提供されるnapDNAbp配列のうちのいずれか1つと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本開示に従って、他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も使用され得ることを理解されたい。
Cas12b/C2c1((uniprot.org/uniprot/T0D7A2#2)sp|T0D7A2|C2C1_ALIAG CRISPR関連エンドヌクレアーゼC2c1 OS=Alicyclobacillus acido-terrestris(株ATCC49025/DSM3922/CIP106132/NCIMB13137/GD3B)GN=c2c1 PE=1 SV=1)アミノ酸配列は、以下のとおりである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b(Alicyclobacillus acidiphilus)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b(Bacillus hisashii)NCBI参照配列:WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
一部の実施形態では、Cas12bは、BvCas12b(V4)であり、これは、BhCas12bのバリアントであり、BhCas12bに対して以下の変化を含む:S893R、K846R、E837G。BhCas12b(V4)は、以下のように表される:5’mRNAキャップ-5’UTR-bhCas12b-STOP配列-3’UTR-120polyAテール。
5’UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3’UTR(TriLink標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b(V4)の核酸配列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
一部の実施形態では、Cas12bは、BvCas12Bである。一部の実施形態では、Cas12bは、以下に提供されるBvCas12bの例示的な配列において番号付けされたアミノ酸置換S893R、K846R、およびE837Gを含む。
BvCas12b(Bacillus種V3-13)NCBI参照配列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
一部の実施形態では、Cas12bは、BTCas12b.BTCas12b(Bacillus thermoamylovorans)である。NCBI参照配列:WP_041902512
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSM
一部の実施形態では、napDNAbpは、Cas12cを指す。一部の実施形態では、Cas12cタンパク質は、Cas12c1またはCas12c1のバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12c2またはCas12c2のバリアントである。一部の実施形態では、Cas12タンパク質は、Oleiphilus種HI0009(すなわち、OspCas12c)由来のCas12cタンパク質またはOspCas12cのバリアントである。これらのCas12c分子は、Yan et al.,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されている(その内容全体が、参照により本明細書に援用される)。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本開示に従って、他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cも使用され得ることを理解されたい。
Cas12c1
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN
Cas12c2
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK
OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL
一部の実施形態では、napDNAbpは、Cas12g、Cas12h、またはCas12iを指し、例えば、Yan et al.,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されている(各々の内容全体が、参照により本明細書に援用される)。10テラバイト超の配列データを集約することにより、V型Casタンパク質の新しい分類が特定され、これは、Cas12g、Cas12h、およびCas12iを含む以前に特徴付けられたクラスVタンパク質との弱い類似性を示した。一部の実施形態では、Cas12タンパク質は、Cas12gまたはCas12gのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12hまたはCas12hのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12iまたはCas12iのバリアントである。他のRNAガイドDNA結合タンパク質が、napDNAbpとして使用されてもよく、本開示の範囲内であることを理解されたい。一部の実施形態では、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本開示に従って、他の細菌種由来のCas12g、Cas12h、またはCas12iも使用され得ることを理解されたい。一部の実施形態では、Cas12iは、Cas12i1またはCas12i2である。
Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV
Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK
Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS
塩基エディターの代表的な核酸配列およびタンパク質配列は、以下のとおりである:
BhCas12b GGSGGS-ABE8-Xten20(P153における)

BhCas12b GGSGGS-ABE8-Xten20(K255における)

BhCas12b GGSGGS-ABE8-Xten20(D306における)

BhCas12b GGSGGS-ABE8-Xten20(D980における)

BhCas12b GGSGGS-ABE8-Xten20(K1019における)
上記の配列に関して、Kozak配列は、太字および下線で示され、N末端核局在化シグナル(NLS)は、マークされ、小文字は、GGGSGGSリンカーを示し、ABE8をコードする配列は、マークされ、非修飾配列は、BhCas12bをコードし、二重下線は、Xten20リンカーを示し、一重下線は、C末端NLSを示し、GGATCC(点下線)は、GSリンカーを示し、斜体文字は、3×ヘマグルチニン(HA)タグのコード配列を示す。
一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12j/CasΦタンパク質であり得る。Cas12j/CasΦは、Pausch et al.,“CRISPR-CasΦ from huge phages is a hypercompact genome editor,”Science,17 July 2020,Vol.369,Issue 6501,pp.333-337に記載されている(その全体が、参照により本明細書に援用される)。一部の実施形態では、napDNAbpは、天然に存在するCas12j/CasΦタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12j/CasΦタンパク質である。一部の実施形態では、napDNAbpは、ヌクレアーゼ不活性(「不活性型(dead)」)Cas12j/CasΦタンパク質である。本開示に従って、他の種由来のCas12j/CasΦも使用され得ることを理解されたい。
例示的なCas12j/CasΦアミノ酸配列は、以下のとおりである:
>CasΦ-1
MADTPTLFTQFLRHHLPGQRFRKDILKQAGRILANKGEDATIAFLRGKSEESPPDFQPPVKCPIIACSRPLTEWPIYQASVAIQGYVYGQSLAEFEASDPGCSKDGLLGWFDKTGVCTDYFSVQGLNLIFQNARKRYIGVQTKVTNRNEKRHKKLKRINAKRIAEGLPELTSDEPESALDETGHLIDPPGLNTNIYCYQQVSPKPLALSEVNQLPTAYAGYSTSGDDPIQPMVTKDRLSISKGQPGYIPEHQRALLSQKKHRRMRGYGLKARALLVIVRIQDDWAVIDLRSLLRNAYWRRIVQTKEPSTITKLLKLVTGDPVLDATRMVATFTYKPGIVQVRSAKCLKNKQGSKLFSERYLNETVSVTSIDLGSNNLVAVATYRLVNGNTPELLQRFTLPSHLVKDFERYKQAHDTLEDSIQKTAVASLPQGQQTEIRMWSMYGFREAQERVCQELGLADGSIPWNVMTATSTILTDLFLARGGDPKKCMFTSEPKKKKNSKQVLYKIRDRAWAKMYRTLLSKETREAWNKALWGLKRGSPDYARLSKRKEELARRCVNYTISTAEKRAQCGRTIVALEDLNIGFFHGRGKQEPGWVGLFTRKKENRWLMQALHKAFLELAHHRGYHVIEVNPAYTSQTCPVCRHCDPDNRDQHNREAFHCIGCGFRGNADLDVATHNIAMVAITGESLKRARGSVASKTPQPLAAE*
>CasΦ-2
MPKPAVESEFSKVLKKHFPGERFRSSYMKRGGKILAAQGEEAVVAYLQGKSEEEPPNFQPPAKCHVVTKSRDFAEWPIMKASEAIQRYIYALSTTERAACKPGKSSESHAAWFAATGVSNHGYSHVQGLNLIFDHTLGRYDGVLKKVQLRNEKARARLESINASRADEGLPEIKAEEEEVATNETGHLLQPPGINPSFYVYQTISPQAYRPRDEIVLPPEYAGYVRDPNAPIPLGVVRNRCDIQKGCPGYIPEWQREAGTAISPKTGKAVTVPGLSPKKNKRMRRYWRSEKEKAQDALLVTVRIGTDWVVIDVRGLLRNARWRTIAPKDISLNALLDLFTGDPVIDVRRNIVTFTYTLDACGTYARKWTLKGKQTKATLDKLTATQTVALVAIDLGQTNPISAGISRVTQENGALQCEPLDRFTLPDDLLKDISAYRIAWDRNEEELRARSVEALPEAQQAEVRALDGVSKETARTQLCADFGLDPKRLPWDKMSSNTTFISEALLSNSVSRDQVFFTPAPKKGAKKKAPVEVMRKDRTWARAYKPRLSVEAQKLKNEALWALKRTSPEYLKLSRRKEELCRRSINYVIEKTRRRTQCQIVIPVIEDLNVRFFHGSGKRLPGWDNFFTAKKENRWFIQGLHKAFSDLRTHRSFYVFEVRPERTSITCPKCGHCEVGNRDGEAFQCLSCGKTCNADLDVATHNLTQVALTGKTMPKREEPRDAQGTAPARKTKKASKSKAPPAEREDQTPAQEPSQTS
>CasΦ-3
MEKEITELTKIRREFPNKKFSSTDMKKAGKLLKAEGPDAVRDFLNSCQEIIGDFKPPVKTNIVSISRPFEEWPVSMVGRAIQEYYFSLTKEELESVHPGTSSEDHKSFFNITGLSNYNYTSVQGLNLIFKNAKAIYDGTLVKANNKNKKLEKKFNEINHKRSLEGLPIITPDFEEPFDENGHLNNPPGINRNIYGYQGCAAKVFVPSKHKMVSLPKEYEGYNRDPNLSLAGFRNRLEIPEGEPGHVPWFQRMDIPEGQIGHVNKIQRFNFVHGKNSGKVKFSDKTGRVKRYHHSKYKDATKPYKFLEESKKVSALDSILAIITIGDDWVVFDIRGLYRNVFYRELAQKGLTAVQLLDLFTGDPVIDPKKGVVTFSYKEGVVPVFSQKIVPRFKSRDTLEKLTSQGPVALLSVDLGQNEPVAARVCSLKNINDKITLDNSCRISFLDDYKKQIKDYRDSLDELEIKIRLEAINSLETNQQVEIRDLDVFSADRAKANTVDMFDIDPNLISWDSMSDARVSTQISDLYLKNGGDESRVYFEINNKRIKRSDYNISQLVRPKLSDSTRKNLNDSIWKLKRTSEEYLKLSKRKLELSRAVVNYTIRQSKLLSGINDIVIILEDLDVKKKFNGRGIRDIGWDNFFSSRKENRWFIPAFHKAFSELSSNRGLCVIEVNPAWTSATCPDCGFCSKENRDGINFTCRKCGVSYHADIDVATLNIARVAVLGKPMSGPADRERLGDTKKPRVARSRKTMKRKDISNSTVEAMVTA*
>CasΦ-4
MYSLEMADLKSEPSLLAKLLRDRFPGKYWLPKYWKLAEKKRLTGGEEAACEYMADKQLDSPPPNFRPPARCVILAKSRPFEDWPVHRVASKAQSFVIGLSEQGFAALRAAPPSTADARRDWLRSHGASEDDLMALEAQLLETIMGNAISLHGGVLKKIDNANVKAAKRLSGRNEARLNKGLQELPPEQEGSAYGADGLLVNPPGLNLNIYCRKSCCPKPVKNTARFVGHYPGYLRDSDSILISGTMDRLTIIEGMPGHIPAWQREQGLVKPGGRRRRLSGSESNMRQKVDPSTGPRRSTRSGTVNRSNQRTGRNGDPLLVEIRMKEDWVLLDARGLLRNLRWRESKRGLSCDHEDLSLSGLLALFSGDPVIDPVRNEVVFLYGEGIIPVRSTKPVGTRQSKKLLERQASMGPLTLISCDLGQTNLIAGRASAISLTHGSLGVRSSVRIELDPEIIKSFERLRKDADRLETEILTAAKETLSDEQRGEVNSHEKDSPQTAKASLCRELGLHPPSLPWGQMGPSTTFIADMLISHGRDDDAFLSHGEFPTLEKRKKFDKRFCLESRPLLSSETRKALNESLWEVKRTSSEYARLSQRKKEMARRAVNFVVEISRRKTGLSNVIVNIEDLNVRIFHGGGKQAPGWDGFFRPKSENRWFIQAIHKAFSDLAAHHGIPVIESDPQRTSMTCPECGHCDSKNRNGVRFLCKGCGASMDADFDAACRNLERVALTGKPMPKPSTSCERLLSATTGKVCSDHSLSHDAIEKAS*
>CasΦ-5
MSSLPTPLELLKQKHADLFKGLQFSSKDNKMAGKVLKKDGEEAALAFLSERGVSRGELPNFRPPAKTLVVAQSRPFEEFPIYRVSEAIQLYVYSLSVKELETVPSGSSTKKEHQRFFQDSSVPDFGYTSVQGLNKIFGLARGIYLGVITRGENQLQKAKSKHEALNKKRRASGEAETEFDPTPYEYMTPERKLAKPPGVNHSIMCYVDISVDEFDFRNPDGIVLPSEYAGYCREINTAIEKGTVDRLGHLKGGPGYIPGHQRKESTTEGPKINFRKGRIRRSYTALYAKRDSRRVRQGKLALPSYRHHMMRLNSNAESAILAVIFFGKDWVVFDLRGLLRNVRWRNLFVDGSTPSTLLGMFGDPVIDPKRGVVAFCYKEQIVPVVSKSITKMVKAPELLNKLYLKSEDPLVLVAIDLGQTNPVGVGVYRVMNASLDYEVVTRFALESELLREIESYRQRTNAFEAQIRAETFDAMTSEEQEEITRVRAFSASKAKENVCHRFGMPVDAVDWATMGSNTIHIAKWVMRHGDPSLVEVLEYRKDNEIKLDKNGVPKKVKLTDKRIANLTSIRLRFSQETSKHYNDTMWELRRKHPVYQKLSKSKADFSRRVVNSIIRRVNHLVPRARIVFIIEDLKNLGKVFHGSGKRELGWDSYFEPKSENRWFIQVLHKAFSETGKHKGYYIIECWPNWTSCTCPKCSCCDSENRHGEVFRCLACGYTCNTDFGTAPDNLVKIATTGKGLPGPKKRCKGSSKGKNPKIARSSETGVSVTESGAPKVKKSSPTQTSQSSSQSAP*
>CasΦ-6
MNKIEKEKTPLAKLMNENFAGLRFPFAIIKQAGKKLLKEGELKTIEYMTGKGSIEPLPNFKPPVKCLIVAKRRDLKYFPICKASCEIQSYVYSLNYKDFMDYFSTPMTSQKQHEEFFKKSGLNIEYQNVAGLNLIFNNVKNTYNGVILKVKNRNEKLKKKAIKNNYEFEEIKTFNDDGCLINKPGINNVIYCFQSISPKILKNITHLPKEYNDYDCSVDRNIIQKYVSRLDIPESQPGHVPEWQRKLPEFNNTNNPRRRRKWYSNGRNISKGYSVDQVNQAKIEDSLLAQIKIGEDWIILDIRGLLRDLNRRELISYKNKLTIKDVLGFFSDYPIIDIKKNLVTFCYKEGVIQVVSQKSIGNKKSKQLLEKLIENKPIALVSIDLGQTNPVSVKISKLNKINNKISIESFTYRFLNEEILKEIEKYRKDYDKLELKLINEA
>CasΦ-7
MSNTAVSTREHMSNKTTPPSPLSLLLRAHFPGLKFESQDYKIAGKKLRDGGPEAVISYLTGKGQAKLKDVKPPAKAFVIAQSRPFIEWDLVRVSRQIQEKIFGIPATKGRPKQDGLSETAFNEAVASLEVDGKSKLNEETRAAFYEVLGLDAPSLHAQAQNALIKSAISIREGVLKKVENRNEKNLSKTKRRKEAGEEATFVEEKAHDERGYLIHPPGVNQTIPGYQAVVIKSCPSDFIGLPSGCLAKESAEALTDYLPHDRMTIPKGQPGYVPEWQHPLLNRRKNRRRRDWYSASLNKPKATCSKRSGTPNRKNSRTDQIQSGRFKGAIPVLMRFQDEWVIIDIRGLLRNARYRKLLKEKSTIPDLLSLFTGDPSIDMRQGVCTFIYKAGQACSAKMVKTKNAPEILSELTKSGPVVLVSIDLGQTNPIAAKVSRVTQLSDGQLSHETLLRELLSNDSSDGKEIARYRVASDRLRDKLANLAVERLSPEHKSEILRAKNDTPALCKARVCAALGLNPEMIAWDKMTPYTEFLATAYLEKGGDRKVATLKPKNRPEMLRRDIKFKGTEGVRIEVSPEAAEAYREAQWDLQRTSPEYLRLSTWKQELTKRILNQLRHKAAKSSQCEVVVMAFEDLNIKMMHGNGKWADGGWDAFFIKKRENRWFMQAFHKSLTELGAHKGVPTIEVTPHRTSITCTKCGHCDKANRDGERFACQKCGFVAHADLEIATDNIERVALTGKPMPKPESERSGDAKKSVGARKAAFKPEEDAEAAE*
>CasΦ-8
MIKPTVSQFLTPGFKLIRNHSRTAGLKLKNEGEEACKKFVRENEIPKDECPNFQGGPAIANIIAKSREFTEWEIYQSSLAIQEVIFTLPKDKLPEPILKEEWRAQWLSEHGLDTVPYKEAAGLNLIIKNAVNTYKGVQVKVDNKNKNNLAKINRKNEIAKLNGEQEISFEEIKAFDDKGYLLQKPSPNKSIYCYQSVSPKPFITSKYHNVNLPEEYIGYYRKSNEPIVSPYQFDRLRIPIGEPGYVPKWQYTFLSKKENKRRKLSKRIKNVSPILGIICIKKDWCVFDMRGLLRTNHWKKYHKPTDSINDLFDYFTGDPVIDTKANVVRFRYKMENGIVNYKPVREKKGKELLENICDQNGSCKLATVDVGQNNPVAIGLFELKKVNGELTKTLISRHPTPIDFCNKITAYRERYDKLESSIKLDAIKQLTSEQKIEVDNYNNNFTPQNTKQIVCSKLNINPNDLPWDKMISGTHFISEKAQVSNKSEIYFTSTDKGKTKDVMKSDYKWFQDYKPKLSKEVRDALSDIEWRLRRESLEFNKLSKSREQDARQLANWISSMCDVIGIENLVKKNNFFGGSGKREPGWDNFYKPKKENRWWINAIHKALTELSQNKGKRVILLPAMRTSITCPKCKYCDSKNRNGEKFNCLKCGIELNADIDVATENLATVAITAQSMPKPTCERSGDAKKPVRARKAKAPEFHDKLAPSYTVVLREAV*
>CasΦ-9
MRSSREIGDKILMRQPAEKTAFQVFRQEVIGTQKLSGGDAKTAGRLYKQGKMEAAREWLLKGARDDVPPNFQPPAKCLVVAVSHPFEEWDISKTNHDVQAYIYAQPLQAEGHLNGLSEKWEDTSADQHKLWFEKTGVPDRGLPVQAINKIAKAAVNRAFGVVRKVENRNEKRRSRDNRIAEHNRENGLTEVVREAPEVATNADGFLLHPPGIDPSILSYASVSPVPYNSSKHSFVRLPEEYQAYNVEPDAPIPQFVVEDRFAIPPGQPGYVPEWQRLKCSTNKHRRMRQWSNQDYKPKAGRRAKPLEFQAHLTRERAKGALLVVMRIKEDWVVFDVRGLLRNVEWRKVLSEEAREKLTLKGLLDLFTGDPVIDTKRGIVTFLYKAEITKILSKRTVKTKNARDLLLRLTEPGEDGLRREVGLVAVDLGQTHPIAAAIYRIGRTSAGALESTVLHRQGLREDQKEKLKEYRKRHTALDSRLRKEAFETLSVEQQKEIVTVSGSGAQITKDKVCNYLGVDPSTLPWEKMGSYTHFISDDFLRRGGDPNIVHFDRQPKKGKVSKKSQRIKRSDSQWVGRMRPRLSQETAKARMEADWAAQNENEEYKRLARSKQELARWCVNTLLQNTRCITQCDEIVVVIEDLNVKSLHGKGAREPGWDNFFTPKTENRWFIQILHKTFSELPKHRGEHVIEGCPLRTSITCPACSYCDKNSRNGEKFVCVACGATFHADFEVATYNLVRLATTGMPMPKSLERQGGGEKAGGARKARKKAKQVEKIVVQANANVTMNGASLHSP*
>CasΦ-10
MDMLDTETNYATETPAQQQDYSPKPPKKAQRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVNIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHRGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*
上記の配列中のアスタリスク(*)は、終止コドンを示す。あるいは、CasΦ-1は、Cas12jオーソログ1とも呼ばれる。したがって、CasΦ-1、CasΦ-10はまた、それぞれ、Cas12jオーソログ1、10とも称され得る。
ガイドポリヌクレオチド
一実施形態では、ガイドポリヌクレオチドは、ガイドRNAである。本明細書で使用される場合、「ガイドRNA(gRNA)」という用語およびその文法的等価物は、標的DNAに特異的であり、Casタンパク質と複合体を形成することができるRNAを指し得る。RNA/Cas複合体は、Casタンパク質を標的DNAに「誘導(guiding)」するのを支援し得る。Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状dsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合およびDNA切断は、典型的には、タンパク質および両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」、または単に「gRNA」)は、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように操作することができる。例えば、Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。Cas9は、CRISPR反復配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己の区別を助ける。Cas9ヌクレアーゼの配列および構造は、当業者に周知である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti J.J.,et al.,Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、および“Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。Cas9オーソログは、これらに限定されないが、S.pyogenesおよびS.thermophilusを含む様々な種で記載されている。さらなる好適なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者には明らかであり得、そのようなCas9ヌクレアーゼおよび配列には、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物および遺伝子座に由来するCas9配列が含まれる(その内容全体が、参照により本明細書に援用される)。一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、Cas9は、ニッカーゼである。
一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのシングルガイドRNA(「sgRNA」または「gRNA」)である。一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。一部の実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列に誘導するためのPAM配列を必要としない。
本明細書に開示される塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、CRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって、標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えば、gRNA)は、典型的には一本鎖であり、部位特異的に(すなわち、相補的な塩基対形成を介して)ポリヌクレオチドの標的配列に結合するようにプログラムすることができ、それによって、ガイド核酸と併せて塩基エディターを標的配列に誘導する。ガイドポリヌクレオチドは、DNAであり得る。ガイドポリヌクレオチドは、RNAであり得る。当業者に理解されるように、ガイドポリヌクレオチド配列において、配列中のチミン(T)が、ウラシル(U)で置き換えられる。一部の実施形態では、ガイドポリヌクレオチドは、天然ヌクレオチド(例えば、アデノシン)を含む。一部の実施形態では、ガイドポリヌクレオチドは、非天然(non-natural)(または、非天然(unnatural))ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含む。一部の実施形態では、ガイド核酸配列の標的領域は、少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド長であり得る。ガイド核酸の標的領域は、10~30ヌクレオチド長、または15~25ヌクレオチド長、または15~20ヌクレオチド長であり得る。一部の実施形態では、ガイドポリヌクレオチドは、特に、5’末端の1、2、3、4ヌクレオチドなどが切断され得る。非限定的な例として、20ヌクレオチド長のガイドポリヌクレオチドは、特に、5’末端の1、2、3、4ヌクレオチドなどが切断され得る。
一部の実施形態では、ガイドポリヌクレオチドは、2つ以上の個々のポリヌクレオチドを含み、例えば、相補的な塩基対形成(例えば、デュアルガイドポリヌクレオチド)を介して、互いに相互作用し得る。例えば、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)およびトランス活性化CRISPR RNA(tracrRNA)を含むことができる。例えば、ガイドポリヌクレオチドは、1つ以上のトランス活性化CRISPR RNA(tracrRNA)を含むことができる。
II型CRISPRシステムでは、CRISPRタンパク質(例えば、Cas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第1のRNA分子(crRNA)と、ガイドRNA-CRISPRタンパク質複合体を安定化する足場領域を形成する反復配列を含む第2のRNA分子(trRNA)との間の相補的な塩基対形成を必要とする。かかるデュアルガイドRNAシステムは、本明細書に開示される塩基エディターを標的ポリヌクレオチド配列に誘導するためのガイドポリヌクレオチドとして用いられ得る。
一部の実施形態では、本発明に提供される塩基エディターは、シングルガイドポリヌクレオチド(例えば、sgRNA)を利用する。一部の実施形態では、本発明に提供される塩基エディターは、デュアルガイドポリヌクレオチド(例えば、デュアルgRNA)を利用する。一部の実施形態では、本明細書に提供される塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば、マルチプルgRNA)を利用する。一部の実施形態では、シングルガイドポリヌクレオチドは、本明細書に記載の異なる塩基エディター用に利用される。例えば、シングルガイドポリヌクレオチドは、シチジン塩基エディターおよびアデノシン塩基エディター用に利用され得る。
他の実施形態では、ガイドポリヌクレオチドは、単一分子(すなわち、単一分子ガイド核酸)中の核酸のポリヌクレオチド標的化部分と核酸の足場部分との両方を含むことができる。例えば、単一分子ガイドポリヌクレオチドは、シングルガイドRNA(sgRNAまたはgRNA)であり得る。本明細書において、ガイドポリヌクレオチド配列という用語は、塩基エディターと相互作用し、標的ポリヌクレオチド配列に誘導し得る任意のシングル、デュアル、またはマルチプル核酸を企図する。
典型的には、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識して結合することができる配列を含む「ポリヌクレオチド標的化セグメント」、および塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン成分内のガイドポリヌクレオチドを安定化する「タンパク質結合セグメント」を含む。一部の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それによって、DNA中の塩基の編集を促進する。他の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識して結合し、それによって、RNA中の塩基の編集を促進する。本明細書において、「セグメント」とは、分子のセクションまたは領域、例えば、ガイドポリヌクレオチド内のヌクレオチドの連続したストレッチを指す。セグメントはまた、セグメントが複数の分子の領域を含むことができるような、複合体の領域/セクションも指し得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、のタンパク質結合セグメントは、例えば、相補領域に沿ってハイブリダイズする複数の別個の分子の全部または一部を含み得る。一部の実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さが100塩基対である第1のRNA分子の40~75塩基対、および(ii)長さが50塩基対である第2のRNA分子の10~25塩基対、を含み得る。「セグメント」の定義は、特定の文脈において別途具体的に定義されない限り、特定の数の総塩基対に限定されず、所与のRNA分子からの任意の特定の数の塩基対に限定されず、複合体内の特定の数の別個の分子に限定されず、任意の全長であり、かつ他の分子と相補性を有する領域を含み得るRNA分子の領域を含み得る。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えば、CRISPR RNA(crRNA)およびトランス活性化crRNA(tracrRNA)を含むことができる。ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAの一部分(例えば、機能部分)の融合によって形成される一本鎖RNAまたはシングルガイドRNA(sgRNA)を含む場合がある。ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAを含むデュアルRNAであり得る。さらに、crRNAは、標的DNAとハイブリダイズすることができる。
上述のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAおよびプロモーターをコードする配列を含むプラスミドDNAを用いて、細胞をトランスフェクトすることによって、細胞に導入することができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス媒介性遺伝子送達を使用するなどの他の方法で、細胞内に導入することもできる。
ガイドRNAまたはガイドポリヌクレオチドは、単離され得る。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトされ得る。ガイドRNAは、当該技術分野で既知の任意のインビトロ転写システムを使用して、インビトロ転写によって調製することができる。ガイドRNAは、ガイドRNAのコード配列を含むプラスミドの形態ではなく、単離されたRNAの形態で、細胞に導入され得る。
ガイドRNAまたはガイドポリヌクレオチドは、3つの領域(染色体配列における標的部位に相補的であり得る5’末端の第1の領域、ステム・ループ構造を形成し得る第2の内部領域、および一本鎖であり得る第3の3’領域)を含むことができる。各ガイドRNAの第1の領域も、各ガイドRNAが融合タンパク質を特定の標的部位に誘導するように異なり得る。さらに、各ガイドRNAの第2の領域および第3の領域は、すべてのガイドRNAにおいて同一であり得る。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、ガイドRNAの第1の領域が標的部位と塩基対を形成することができるように、染色体配列中の標的部位の配列に相補的であり得る。一部の実施形態では、ガイドRNAの第1の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチド~ヌクレオチド、もしくは約10ヌクレオチド~約25ヌクレオチド、もしくは10ヌクレオチド~約25ヌクレオチド、もしくは約10ヌクレオチド~25ヌクレオチド)、またはそれ以上を含むことができる。例えば、ガイドRNAの第1の領域と染色体配列中の標的部位との間の塩基対形成の領域は、10、11、12、13、14、15、16、17、18、19、20、22、23、24、25ヌクレオチド長、もしくはそれ以上であり得るか、または約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25ヌクレオチド長、もしくは約それ以上であり得る。一部の実施形態では、ガイドRNAの第1の領域は、19、20、もしくは21ヌクレオチド長であり得るか、または約19、20、もしくは21ヌクレオチド長であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域も含むことができる。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)およびループを含むことができる。ループおよびステムの長さは、異なり得る。例えば、ループは、3~10ヌクレオチド長または約3~10ヌクレオチド長の範囲であり得、ステムは、6~20塩基対長または約6~20塩基対長の範囲であり得る。ステムは、1~10ヌクレオチドまたは約10ヌクレオチドの1つ以上のバルジを含むことができる。第2の領域の全長は、16~60ヌクレオチド長または約16~60ヌクレオチド長の範囲であり得る。例えば、ループは、約4ヌクレオチド長または約4ヌクレオチド長であり得、ステムは、12塩基対長または約12塩基対であり得る。
ガイドRNAまたはガイドポリヌクレオチドはまた、本質的に一本鎖であり得る3’末端の第3の領域を含むことができる。例えば、第3の領域は、目的の細胞における任意の染色体配列に対して相補的ではない場合があり、ガイドRNAの残部に対して相補的ではない場合がある。さらに、第3の領域の長さは、異なり得る。第3の領域は、4ヌクレオチド長以上または約4ヌクレオチド長以上であり得る。例えば、第3の領域の長さは、5~60ヌクレオチド長または約5~60ヌクレオチド長の範囲であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエキソンまたはイントロンを標的とすることができる。一部の実施形態では、ガイドは、遺伝子のエキソン1またはエキソン2を標的とすることができ、他の実施形態では、ガイドは、遺伝子のエキソン3またはエキソン4を標的とすることができる。組成物は、すべて同じエキソンを標的とする複数のガイドRNAを含むことができ、または一部の実施形態では、異なるエキソンを標的とすることができる複数のガイドRNAを含むことができる。遺伝子のエキソンおよびイントロンを標的とすることができる。
ガイドRNAまたはガイドポリヌクレオチドは、20ヌクレオチドまたは約20ヌクレオチドの核酸配列を標的とすることができる。標的核酸は、20ヌクレオチド未満または約20ヌクレオチド未満であり得る。標的核酸は、少なくともまたは少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチド長の任意の長さであり得る。標的核酸は、最大または最大約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、または1~100ヌクレオチド長の任意の長さであり得る。標的核酸配列は、PAMの第1のヌクレオチドのすぐ5’の20塩基または約20塩基であり得る。ガイドRNAは、核酸配列を標的とすることができる。標的核酸は、少なくともまたは少なくとも約1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
ガイドポリヌクレオチド(例えば、ガイドRNA)は、別の核酸(例えば、細胞のゲノム中の標的核酸またはプロトスペーサー)にハイブリダイズすることができる核酸を指し得る。ガイドポリヌクレオチドは、RNAであり得る。ガイドポリヌクレオチドは、DNAであり得る。ガイドポリヌクレオチドは、部位特異的に核酸の配列に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、ポリヌクレオチド鎖を含み得、シングルガイドポリヌクレオチドと呼ぶことができる。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含むことができ、ダブルガイドポリヌクレオチドと呼ぶことができる。ガイドRNAは、RNA分子として細胞または胚に導入することができる。例えば、RNA分子は、インビトロで転写され得、および/または化学的に合成され得る。RNAは、合成DNA分子、例えば、gBlocks(登録商標)遺伝子断片から転写され得る。次いで、ガイドRNAを、RNA分子として細胞または胚に導入することができる。ガイドRNAはまた、非RNA核酸分子(例えば、DNA分子)の形態で細胞または胚に導入することもできる。例えば、ガイドRNAをコードするDNAは、目的の細胞または胚におけるガイドRNAの発現のためのプロモーター制御配列に作動可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII(PolIII)によって認識されるプロモーター配列に作動可能に連結され得る。ガイドRNAを発現するために使用され得るプラスミドベクターには、px330ベクターおよびpx333ベクターが含まれるが、これらに限定されない。一部の実施形態では、プラスミドベクター(例えば、px333ベクター)は、少なくとも2つのガイドRNAコードDNA配列を含むことができる。
ガイドポリヌクレオチド(例えば、ガイドRNA)および標的化配列を選択、設計、および検証するための方法は、本明細書に記載されており、当業者に既知である。例えば、核酸塩基エディターシステムのデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質混乱の影響を最小化するために、非意図的に脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に存在し得るオフターゲットのC残基)の数を最小化してもよい。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化し、例えば、ゲノムにわたって総オフターゲット活性を最小化することができる。例えば、S.pyogenes Cas9を使用する各可能な標的化ドメインの選択の場合、すべてのオフターゲット配列(前述の選択されたPAM、例えば、NAGまたはNGG)は、最大で一定数(例えば、1、2、3、4、5、6、7、8、9、または10)の不一致塩基対を含むゲノムにわたって特定され得る。標的部位に相補的なgRNAの第1の領域を特定することができ、すべての第1の領域(例えば、crRNA)は、その総予測オフターゲットスコアに従ってランク付けすることができ、上位の標的化ドメインは、最大のオンターゲット活性および最小のオフターゲット活性を有する可能性が高いものを表す。gRNAを標的とする候補は、当該技術分野で既知である方法、および/または本明細書に記載の方法を使用することによって機能的に評価することができる。
非限定的な例として、Cas9を使用するガイドRNAのcrRNAにおける標的DNAがハイブリダイズする配列は、DNA配列検索アルゴリズムを使用して特定することができる。gRNAの設計は、公的ツールベースのカスタムgRNA設計ソフトウェアであるcas-offinderを使用して実施してもよい(Bae S.,Park J.,&Kim J.-S.Cas-OFFinder:A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases.Bioinformatics 30,1473-1475(2014)に記載されている)。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後、ガイドをスコア付けする。典型的には、長さが17~24の範囲のガイドの場合、完全一致から7つの不一致までの範囲の一致が考慮される。オフターゲット部位が計算的に決定されると、各ガイドについて集計スコアが計算され、ウェブインターフェースを使用して表形式出力で要約される。本ソフトウェアは、PAM配列に隣接する潜在的な標的部位を特定することに加えて、選択された標的部位から1、2、3個、または3個超のヌクレオチドが異なるすべてのPAM隣接配列も特定する。標的核酸配列(例えば、標的遺伝子)のゲノムDNA配列を取得してもよく、公的に利用可能なツール(例えば、RepeatMaskerプログラム)を使用して、反復エレメントをスクリーニングしてもよい。RepeatMaskerは、入力DNA配列を、反復エレメントおよび低複雑度領域について検索する。出力は、所与のクエリ配列に存在する反復の詳細な注釈である。
特定後、ガイドRNAの第1の領域(例えば、crRNA)を、標的部位までのそれらの距離、それらの直交性、および関連するPAM配列との密接な一致についての5’ヌクレオチドの存在に基づいて(例えば、関連するPAM(例えば、S.pyogenesのNGG PAM、S.aureusのNNGRRTまたはNNGRRV PAM)を含むヒトゲノム内の密接な一致の特定に基づく5’G)、階層にランク付けしてもよい。本明細書で使用される場合、直交性(orthogonality)は、標的配列に対する最小数の不一致を含むヒトゲノム内の配列の数を指す。「高レベルの直交性」または「良好な直交性」は、例えば、ヒトゲノム中に、意図された標的以外に同一の配列を有しないか、または標的配列中に1つもしくは2つの不一致を含む任意の配列も有しない20量体の標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するために選択され得る。
一部の実施形態では、レポーターシステムを使用して、塩基編集活性を検出し、候補ガイドポリヌクレオチドを試験することができる。一部の実施形態では、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現につながるレポーター遺伝子ベースのアッセイを含み得る。例えば、レポーターシステムは、非活性化開始コドン(例えば、鋳型鎖上の3’-TAC-5’から3’-CAC-5’への変異)を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは、5’-GUG-3’の代わりに5’-AUG-3’として転写され、レポーター遺伝子の翻訳を可能にする。好適なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、または当業者にとって検出可能であり、かつ明らかな任意の他の遺伝子が挙げられる。レポーターシステムを使用して、例えば、標的DNA配列に関して、それぞれのデアミナーゼが標的とするヌクレオチド残基を決定するために、多くの異なるgRNAを試験することができる。非鋳型鎖ヌクレオチド残基を標的とするsgRNAもまた、特定の塩基編集タンパク質(例えば、Cas9デアミナーゼ融合タンパク質)のオフターゲット効果を評価するために試験することができる。一部の実施形態では、このようなgRNAは、変異した開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準ヌクレオチド、修飾ヌクレオチド(例えば、シュードウリジン)、ヌクレオチド異性体、および/またはヌクレオチド類似体を含むことができる。一部の実施形態では、ガイドポリヌクレオチドは少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、Haloタグ、または任意の他の好適な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であり得る。
ガイドポリヌクレオチドは、化学的および/または酵素的に合成することができる。例えば、ガイドRNAは、標準的なホスホロアミダイトベースの固相合成法を使用して合成することができる。あるいは、ガイドRNAは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼによって認識されるプロモーター制御配列に作動可能に連結することによって、インビトロで合成することができる。好適なファージプロモーター配列の例としては、T7、T3、SP6プロモーター配列、またはそれらのバリエーションが挙げられる。ガイドRNAが2つの別個の分子(例えば、crRNAおよびtracrRNA)を含む実施形態では、crRNAを化学的に合成することができ、tracrRNAを酵素的に合成することができる。
一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド(例えば、gRNA)を含み得る。例えば、gRNAは、塩基エディターを、1つ以上の標的遺伝子座(例えば、少なくとも1個(1)のgRNA、少なくとも2個のgRNA、少なくとも5個のgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、または少なくとも50個のgRNA)に標的指向化させることができる。一部の実施形態では、複数のgRNA配列は、直列に配置することができ、好ましくは、直列反復(direct repeat)によって分離される。
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列もまた、ベクターの一部であり得る。一部の実施形態では、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含む。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA分子は、環状または直鎖状であり得る。
一部の実施形態では、塩基エディターシステムの1つ以上の成分は、DNA配列によってコードされ得る。かかるDNA配列は、発現システム(例えば、細胞)に、一緒にまたは別々に導入され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列は、細胞に導入されてもよく、各DNA配列は、別個の分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのコード配列を含む1つのベクター、およびガイドRNAのコード配列を含む第2のベクター)の一部であってもよく、または両方とも同じ分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインとガイドRNAの両方のコード配列(および調節配列)を含む1つのベクター)の一部であってもよい。
ガイドポリヌクレオチドは、新しい特徴または増強された特徴を有する核酸を提供するために、1つ以上の修飾を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。
一部の実施形態では、gRNAまたはガイドポリヌクレオチドは、修飾を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置で行われ得る。単一のgRNAまたはガイドポリヌクレオチドに対して、2つ以上の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に、品質管理に供され得る。一部の実施形態では、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組み合わせを含むことができる。
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学修飾、物理修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
また、gRNAまたはガイドポリヌクレオチドは、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9,3’-3’修飾、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、シュードウリジン-5’-三リン酸、5’-メチルシチジン-5’-三リン酸、またはそれらの任意の組み合わせによって修飾されてもよい。
一部の実施形態では、修飾は、持続的である。他の実施形態では、修飾は、一過的である。一部の実施形態では、gRNAまたはガイドポリヌクレオチドに、複数の修飾が行われる。gRNAまたはガイドポリヌクレオチド修飾は、ヌクレオチドの生理化学的特性(例えば、ヌクレオチドの立体構造、極性、疎水性、化学反応性、塩基対相互作用、またはそれらの任意の組み合わせ)を変化させることができる。
修飾は、ホスホロチオエート置換体であり得る。一部の実施形態では、天然のホスホジエステル結合は、細胞のヌクレアーゼによる急速な分解を受けやすく、ホスホロチオエート(PS)結合置換体を使用するヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定であり得る。修飾は、gRNAまたはガイドポリヌクレオチドにおける安定性を増加させることができる。修飾はまた、生物学的活性を増強することもできる。一部の実施形態では、ホスホロチオエート増強型RNAのgRNAは、RNaseA、RNaseT1、仔牛血清ヌクレアーゼ、またはそれらの任意の組み合わせを阻害することができる。これらの特性は、インビボまたはインビトロでヌクレアーゼに曝露される可能性が高い用途において、PS-RNA gRNAの使用を可能にすることができる。例えば、ホスホロチオエート(PS)結合を、gRNAの5’末端または’’末端の最後の3~5ヌクレオチド間に導入して、エキソヌクレアーゼ分解を阻害することができる。一部の実施形態では、ホスホロチオエート結合は、エンドヌクレアーゼによる攻撃を低減するために、gRNA全体にわたって付加することができる。
一部の実施形態では、ガイドRNAは、スプライス部位(すなわち、スプライスアクセプター(SA)またはスプライスドナー(SD))を破壊するように設計される。一部の実施形態では、ガイドRNAは、塩基編集が未熟終止コドンをもたらすように設計される。表4A~4Bは、スプライス部位を破壊するか、または未熟終止コドンをもたらすように設計されたgRNA標的配列の非網羅的なリストを提供する。

プロトスペーサー隣接モチーフ
「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフという用語は、CRISPR細菌適応免疫系において、Cas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対のDNA配列を指す。一部の実施形態では、PAMは、5’PAMであり得る(すなわち、プロトスペーサーの5’末端の上流に位置する)。他の実施形態では、PAMは、3’PAMであり得る(すなわち、プロトスペーサーの5’末端の下流に位置する)。PAM配列は、標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。PAM配列は、当該技術分野で既知の任意のPAM配列であり得る。好適なPAM配列には、NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが含まれるが、これらに限定されない。Yは、ピリミジンであり、Nは、任意のヌクレオチド塩基であり、Wは、AまたはTである。
本明細書に提供される塩基エディターは、CRISPRタンパク質由来ドメインを含むことができ、これは、正準または非正準プロトスペーサー隣接モチーフ(PAM)配列を含むヌクレオチド配列に結合することができる。PAM部位は、標的ポリヌクレオチド配列に近接したヌクレオチド配列である。本開示の一部の態様は、塩基エディターを提供し、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む。
例えば、典型的には、S.pyogenes(spCas9)由来のCas9などのCas9タンパク質は、特定の核酸領域に結合するために正準NGG PAM配列を必要とする(ここで、「NGG」における「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gは、グアニンである)。PAMは、CRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは、標的配列の5’または3’であり得る。PAMは、標的配列の上流または下流であり得る。PAMは、1、2、3、4、5、6、7、8、9、10ヌクレオチド長、またはそれ以上であり得る。多くの場合、PAMは、2~6ヌクレオチド長である。
一部の実施形態では、PAMは、「NRN」PAMであるか(ここで、「NRN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Rは、アデニン(A)またはグアニン(G)である)、またはPAMは、「NYN」PAMである(ここで、「NYN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Yは、シチジン(C)またはチミン(T)である)。例えば、R.T.Walton et al.,2020,Science,10.1126/science.aba8853(2020)に記載されている(その内容全体が、参照により本明細書に援用される)。
以下の表5に、いくつかのPAMバリアントを記載する。
一部の実施形態では、PAMは、NGCである。一部の実施形態では、NGC PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rから選択される1つ以上のアミノ酸置換を含む(総称して「MQKFRAER」)。
一部の実施形態では、PAMは、NGTである。一部の実施形態では、NGT PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1335、1337、1135、1136、1218、および/または1219における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1219、1335、1337、1218における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1135、1136、1218、1219、および1335における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、以下の表6Aおよび6Bに提供される標的化変異導入のセットから選択される。

一部の実施形態では、NGT PAMバリアントは、表6Aおよび表6Bのバリアント5、7、28、31、または36から選択される。一部の実施形態では、バリアントは、改善されたNGT PAM認識を有する。
一部の実施形態では、NGT PAMバリアントは、残基1219、1335、1337、および/または1218に変異を有する。一部の実施形態では、NGT PAMバリアントは、認識を改善するための変異を有する、以下の表7に提供されるバリアントから選択される。
一部の実施形態では、NGT PAMは、以下の表8に提供されるバリアントから選択される。
一部の実施形態では、NGTNバリアントは、バリアント1である。一部の実施形態では、NGTNバリアントは、バリアント2である。一部の実施形態では、NGTNバリアントは、バリアント3である。一部の実施形態では、NGTNバリアントは、バリアント4である。一部の実施形態では、NGTNバリアントは、バリアント5である。一部の実施形態では、NGTNバリアントは、バリアント6である。
一部の実施形態では、Cas9ドメインは、Streptococcus pyogenes(SpCas9)由来のCas9ドメインである。一部の実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9(SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。一部の実施形態では、SpCas9は、D9X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含み、Xは、Dを除く任意のアミノ酸である。一部の実施形態では、SpCas9は、D9A変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。
一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、およびT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。
一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかのCas9ドメインは、本明細書に記載のCas9ポリペプチドと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかのCas9ドメインは、本明細書において記載の任意のCas9ポリペプチドのアミノ酸配列からなる。
一部の実施例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードする挿入物(例えば、AAV挿入物)に別個に対するオリゴヌクレオチド上で、細胞に提供され得る。かかる実施形態では、別個のオリゴヌクレオチド上にPAMを提供することで、標的配列の切断を可能になり、さもなければ、隣接するPAMが標的配列と同じポリヌクレオチド上に存在しないため、切断することができない。
一実施形態では、S.pyogenes Cas9(SpCas9)は、ゲノム操作のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用することができる。一部の実施形態では、異なるエンドヌクレアーゼを使用して、特定のゲノム標的を標的とすることができる。一部の実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。加えて、様々な種に由来する他のCas9オーソログが同定されており、これらの「非SpCas9」は、本開示にも有用であり得る様々なPAM配列に結合することができる。例えば、比較的大きなサイズのSpCas9(約4kbのコード配列)は、細胞内で効率的に発現され得ないSpCas9 cDNAを有するプラスミドをもたらす可能性がある。逆に、Staphylococcus aureus Cas9(SaCas9)のコード配列は、SpCas9よりも約1キロ塩基短く、おそらく、細胞内でそれを効率的に発現させる。SpCas9と同様に、SaCas9エンドヌクレアーゼは、インビトロおよびマウスにおけるインビボで、哺乳動物細胞の標的遺伝子を修飾することができる。一部の実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。一部の実施形態では、標的遺伝子は、例えば、Cas9 PAM、5’-NGGに隣接し得る。他の実施形態では、他のCas9オーソログは、異なるPAM要件を有し得る。例えば、S.thermophilus(CRISPR1では5’-NNAGAA、CRISPR3では5’-NGGNG)およびNeisseria meningitidis(5’-NNNNGATT)などの他のPAMも、標的遺伝子に隣接して見出され得る。
一部の実施形態では、S.pyogenesシステムの場合、標的遺伝子配列は、5’-NGG PAMに先行し得る(すなわち、5’側)。20ntガイドRNA配列は、PAMに隣接するCas9切断を媒介するために、反対側の鎖と塩基対を形成し得る。一部の実施形態では、隣接カットは、PAMの3塩基対上流であり得るか、または約10塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの10塩基対上流であり得るか、または約10塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの0~20塩基対上流であり得るか、または約0~20塩基対上流であり得る。例えば、隣接カットは、PAMの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対上流に隣接し得る。隣接カットは、PAMの1~30塩基対下流であり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下のとおりである。
例示的なPAM結合SpCas9のアミノ酸配列は、以下のとおりである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合SpCas9nのアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合SpEQR Cas9のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESVLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記の配列では、残基E1135、Q1335、およびR1337が、下線および太字で示されている(D1135、R1335、およびT1337から変異させて、SpEQR Cas9を得ることができる)。
例示的なPAM結合SpVQR Cas9のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記の配列では、残基V1135、Q1335、およびR1337が、下線および太字で示されている(D1135、R1335、およびT1337から変異させて、SpVQR Cas9を得ることができる)。
例示的なPAM結合SpVRER Cas9のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
上記の配列では、残基V1135、R1218、Q1335、およびR1337が、下線および太字で示されている(D1135、G1218、R1335、およびT1337から変異させて、SpVRER Cas9を得ることができる)。
一部の実施形態では、操作されたSpCas9バリアントは、3’H(非G PAM)に隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識することができる(表3A~3Dを参照されたい)。一部の実施形態では、SpCas9バリアントは、NRNH PAMを認識する(ここで、Rは、AまたはGであり、Hは、A、C、またはTである)。一部の実施形態では、非G PAMは、NRRH、NRTH、またはNRCHである(例えば、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)を参照されたい(その内容は、その全体が参照により本明細書に援用される)。
一部の実施形態では、Cas9ドメインは、組換えCas9ドメインである。一部の実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。一部の実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
天然の5’-NAAN-3’PAM特異性を有するStreptococcus macacaeにおける例示的なCas9 Aホモログの配列は、当該技術分野で既知であり、例えば、Jakimo et al.,(www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)に記載されており、以下に提供される。
SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
一部の実施形態では、バリアントCas9タンパク質は、ポリペプチドが標的DNAまたはRNAを切断する能力が低下するように、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を有する。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。かかるCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、一部のかかる事例では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、PAM配列を必要としない。言い換えると、一部の実施形態では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、ガイドRNAを含み得るが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的化セグメントによって提供される)。他の残基を変異させて、上記の効果を達成することができる(すなわち、一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、正準PAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非正準PAM配列を用いることができる。かかる配列は当該技術分野において記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015)、およびKleinstiver,B.P.,et al.,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)、R.T.Walton et al.“Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants”Science 10.1126/science.aba8853(2020)、Hu et al.“Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,”Nature,2018 Apr.5,556(7699),57-63、Miller et al.,“Continuous evolution of SpCas9 variants compatible with non-G PAMs”Nat.Biotechnol.,2020 Apr;38(4):471-481に記載されている(各々の内容全体が、参照により本明細書に援用される)。
排他性が低下したCas9ドメイン
典型的には、S.pyogenes(spCas9)由来のCas9などのCas9タンパク質は、特定の核酸領域に結合するために正準NGG PAM配列を必要とする(ここで、「NGG」における「N」は、アデノシン(A)、チミジン(T)、またはシトシン(C)であり、Gは、グアノシンである)。これにより、ゲノム内で所望の塩基を編集する能力が制限され得る。一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置(例えば、PAMの上流にある標的塩基を含む領域)に配置される必要があり得る。例えば、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)を参照されたい(その内容全体が、参照により本明細書に援用される)。したがって、一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、正準(例えば、NGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非正準PAM配列に結合するCas9ドメインは、当該技術分野において記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015)、およびKleinstiver,B.P.,et al.,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)に記載されている(各々の内容全体が、参照により本明細書に援用される)。
内部挿入を有する融合タンパク質
核酸プログラマブル核酸結合タンパク質(例えば、napDNAbp)に融合された異種ポリペプチドを含む融合タンパク質が本明細書に提供される。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列には見られないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端、またはnapDNAbpの内部の位置に挿入されたnapDNAbpに融合することができる。一部の実施形態では、異種ポリペプチドは、napDNAbpの内部位置に挿入される。一部の実施形態では、異種ポリペプチドは、デアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、N末端断片に隣接するデアミナーゼと、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのC末端断片とを含むことができる。融合タンパク質中のデアミナーゼは、シチジンデアミナーゼであってもよい。一部の実施形態では、シチジンデアミナーゼは、APOBECデアミナーゼ(例えば、APOBEC1)である。融合タンパク質中のデアミナーゼは、アデノシンデアミナーゼであり得る。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10またはTadA*8)である。一部の実施形態では、TadAは、TadA*8またはTadA*9である。本明細書に記載されるTadA配列(例えば、TadA7.10またはTadA*8)は、上記の融合タンパク質に好適なデアミナーゼである。
一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[napDNAbpのN末端断片]-[デアミナーゼ]-[napDNAbpのC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[アデノシンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[アデノシンデアミナーゼ]-[Cas12のC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[シチジンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[シチジンデアミナーゼ]-[Cas12のC末端断片]-COOH、
式中、「]-[」の各事例は、任意のリンカーである。
デアミナーゼは、円順列変異体(circular permutant)デアミナーゼであり得る。例えば、デアミナーゼは、円順列変異体アデノシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼは、円順列変異体TadAであり、アミノ酸残基116(TadA参照配列において番号付けされている)で円順列変異導入されている。一部の実施形態では、デアミナーゼは、円順列変異体TadAであり、アミノ酸残基136(TadA参照配列において番号付けされている)で円順列変異導入されている。一部の実施形態では、デアミナーゼは、円順列変異体TadAであり、アミノ酸残基65(TadA参照配列において番号付けされている)で円順列変異導入されている。
融合タンパク質は、複数のデアミナーゼを含むことができる。融合タンパク質は、例えば、1、2、3、4、5つ、またはそれ以上のデアミナーゼを含むことができる。一部の実施形態では、融合タンパク質は1つのデアミナーゼを含む。一部の実施形態では、融合タンパク質は、2つのデアミナーゼを含む。融合タンパク質中の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組み合わせであってもよい。2つ以上のデアミナーゼは、ホモ二量体であり得る。2つ以上のデアミナーゼは、ヘテロ二量体であり得る。2つ以上のデアミナーゼは、napDNAbpにおいて直列に挿入され得る。一部の実施形態では、2つ以上のデアミナーゼは、napDNAbpにおいて直列ではない場合がある。
一部の実施形態では、融合タンパク質中のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。一部の実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活性型Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質中のCas9ポリペプチドは、全長Cas9ポリペプチドであり得る。場合によっては、融合タンパク質中のCas9ポリペプチドは、全長Cas9ポリペプチドではない場合がある。Cas9ポリペプチドは、例えば、天然に存在するCas9タンパク質に対して、N末端またはC末端で切断され得る。Cas9ポリペプチドは、円順列変異導入Cas9タンパク質であり得る。Cas9ポリペプチドは、Cas9ポリペプチドの断片、部分、またはドメインであり得、標的ポリヌクレオチドおよびガイド核酸配列に依然として結合することができる。
一部の実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus1 Cas9(St1Cas9)、またはそれらの断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然に存在するCas9ポリペプチドと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含むことができる。
融合タンパク質のCas9ポリペプチドは、以下に記載されるCas9アミノ酸配列(以下、「Cas9参照配列」と称される)と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含むことができる。
(一重下線:HNHドメイン、二重下線:RuvCドメイン)。
Cas9ポリペプチドのN末端断片およびC末端断片に隣接する異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法における塩基編集にも有用である。Cas9および1つ以上のデアミナーゼドメインを含む(例えば、アデノシンデアミナーゼ、またはCas9配列に隣接するアデノシンデアミナーゼドメインを含む)融合タンパク質は、標的配列の非常に特異的かつ効率的な塩基編集にも有用である。一実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含む。一部の実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメインおよびシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼは、Cas9内で融合され、シチジンデアミナーゼは、C末端に融合される。一部の実施形態では、アデノシンデアミナーゼは、Cas9内で融合され、シチジンデアミナーゼは、N末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas9内で融合され、アデノシンデアミナーゼは、C末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas9内で融合され、アデノシンデアミナーゼは、N末端に融合される。
アデノシンデアミナーゼおよびシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH、
NH-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。
様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8は、Cas9内で融合され、シチジンデアミナーゼは、C末端に融合される。一部の実施形態では、TadA*8は、Cas9内で融合され、シチジンデアミナーゼは、N末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas9内で融合され、TadA*8は、C末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas9内で融合され、TadA*8は、N末端に融合される。TadA*8およびシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH、
NH-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOH、または
NH-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。
異種ポリペプチド(例えば、デアミナーゼ)は、例えば、napDNAbpが標的ポリヌクレオチドおよびガイド核酸に結合する能力を保持するように、好適な位置でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、デアミナーゼ(例えば、塩基編集活性)またはnapDNAbp(例えば、標的核酸およびガイド核酸に結合する能力)の機能を損なうことなく、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、結晶学的研究によって示されるように、例えば、無秩序領域、または高温因子(high temperature factor)もしくはB因子を含む領域で、napDNAbpに挿入することができる。タンパク質の秩序領域、無秩序領域、または非構造化領域(例えば、溶媒曝露領域およびループ)は、構造または機能を損なうことなく、挿入に使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、可動性ループ(flexible loop)領域または溶媒曝露領域においてnapDNAbpに挿入することができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの可動性ループに挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、平均B因子よりも高い(例えば、全タンパク質または無秩序領域を含むタンパク質ドメインと比較して、より高いB因子)を含むCas9ポリペプチドの領域に挿入される。B因子または温度因子は、(例えば、温度依存性の原子振動または結晶格子内の静的乱れ(static disorder)の結果としての)原子のそれらの平均位置からの変動を示し得る。骨格原子の高いB因子(例えば、平均よりも高いB因子)は、比較的高い局所移動度(local mobility)を有する領域を示し得る。このような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、全タンパク質の平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有するCα原子を有する残基を含む位置に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基を含むCas9タンパク質ドメインの平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有する残基を含む位置に挿入することができる。平均よりも高いB因子を含むCas9ポリペプチドの位置は、例えば、上記のCas9参照配列において番号付けされた残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248を含むことができる。平均B因子よりも高いB因子を含むCas9ポリペプチド領域は、例えば、上記のCas9参照配列において番号付けされた残基792~872、792~906、および2~791を含むことができる。
異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249、もしくは1249-1250、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248、または別のCas9ポリペプチドの対応するアミノ酸残基。挿入位置に関して、上記のCas9参照配列への言及は、例示的な目的のためであることを理解されたい。本明細書で論じられる挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されないが、バリアントCas9ポリペプチド(例えば、Cas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性型Cas9(dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、切断型Cas9、またはHNHドメインを部分的または完全に欠くCas9ドメイン)における対応する場所における挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069、もしくは1247-1248、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載のアミノ酸残基または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入され得る。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、および1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基のN末端またはC末端で挿入されるか、または残基を置き換えることができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基のC末端において挿入される。
一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、以下からなる群から選択されるアミノ酸残基において挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列において番号付けされた残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチドの対応するアミノ酸残基の代わりに挿入される。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドの対応するアミノ酸残基。
一部の実施形態では、シチジンデアミナーゼ(例えば、APOBEC1)は、以下からなる群から選択されるアミノ酸残基において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、および1247、または別のCas9ポリペプチドの対応するアミノ酸残基。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791もしくはアミノ酸残基792、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791のN末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791のC末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791もしくはアミノ酸792、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のN末端もしくはアミノ酸残基1023のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のC末端もしくはアミノ酸残基1023のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のN末端もしくはアミノ酸残基1029のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のC末端もしくはアミノ酸残基1029のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のN末端もしくはアミノ酸残基1054のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のC末端もしくはアミノ酸残基1054のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のN末端もしくはアミノ酸残基1068のN末端もしくはアミノ酸残基1069のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のC末端もしくはアミノ酸残基1068のC末端もしくはアミノ酸残基1069のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のN末端もしくはアミノ酸残基1247のN末端もしくはアミノ酸残基1248のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のC末端もしくはアミノ酸残基1247のC末端もしくはアミノ酸残基1248のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
一部の実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの可動性ループに挿入される。可動性ループ部分は、上記のCas9参照配列において番号付けされたアミノ酸残基530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。可動性ループ部分は、以下からなる群から選択することができる:上記のCas9参照配列において番号付けされたアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチドの対応するアミノ酸残基。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、以下のアミノ酸残基に対応するCas9ポリペプチド領域に挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入され得る。欠失領域は、Cas9ポリペプチドのN末端部分またはC末端部分に対応し得る。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792~872、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792~906、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基2~791、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基1017~1069、またはその対応するアミノ酸残基に対応する。
以下の表9に、例示的な内部融合塩基エディターが提供される。
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造または機能ドメイン内に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造または機能ドメイン間に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、例えば、Cas9ポリペプチドからドメインを欠失させた後に、Cas9ポリペプチドの構造または機能ドメインの代わりに挿入され得る。Cas9ポリペプチドの構造または機能ドメインは、例えば、RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHを含むことができる。
一部の実施形態では、Cas9ポリペプチドは、以下からなる群から選択される1つ以上のドメインを欠く:RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHドメイン。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインの一部を欠き、そのため、Cas9ポリペプチドは、HNH活性が低下または消失している。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼが、ヌクレアーゼドメインを置き換えるために挿入される。一部の実施形態では、HNHドメインが欠失され、デアミナーゼが、その場所に挿入される。一部の実施形態では、RuvCドメインのうちの1つ以上が欠失され、デアミナーゼが、その場所に挿入される。
異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端断片およびC末端断片に隣接し得る。一部の実施形態では、融合タンパク質は、N末端断片に隣接するデアミナーゼと、Cas9ポリペプチドのC末端断片と、を含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの可動性ループの一部を含むことができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのαヘリックス構造の一部を含むことができる。N末端断片またはC末端断片は、DNA結合ドメインを含むことができる。N末端断片またはC末端断片は、RuvCドメインを含むことができる。N末端断片またはC末端断片は、HNHドメインを含むことができる。一部の実施形態では、N末端断片およびC末端断片のいずれかは、HNHドメインを含まない。
一部の実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。一部の実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。異なるデアミナーゼの挿入場所は、標的核酸塩基とN末端Cas9断片のC末端またはC末端Cas9断片のN末端のアミノ酸との間に近接性を持たせるために、異なり得る。例えば、デアミナーゼの挿入位置は、以下からなる群から選択されるアミノ酸残基にあり得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドの対応するアミノ酸残基。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含むことができる。融合タンパク質のN末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の鎖長を含むことができる。融合タンパク質のN末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含むことができる。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含むことができる。融合タンパク質のC末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の鎖長を含むことができる。融合タンパク質のC末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含むことができる。
融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、一緒にまとめて、例えば、上記のCas9参照配列に記載されるような、天然に存在する全長のCas9ポリペプチド配列に対応しない場合がある。
本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位(例えば、オフターゲット部位)における脱アミノ化が低減される(例えば、ゲノムワイドの擬脱アミノ化が低減される)。本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位におけるバイスタンダー(bystander)脱アミノが低減される。望ましくない脱アミノまたはオフターゲット脱アミノは、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端(end terminus)融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低減され得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低減され得る。
一部の実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Rループの範囲内の2つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の3つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、三本鎖核酸構造であり、DNA:RNAハイブリッド、DNA:DNA、またはRNA:RNA相補構造を含み、一本鎖DNAと会合している。本明細書で使用される場合、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触すると形成され得、ガイドポリヌクレオチドの一部分(例えば、ガイドRNA)が、標的ポリヌクレオチドの一部分(例えば、標的DNA)とハイブリダイズし、それを置換する。一部の実施形態では、Rループは、スペーサー配列のハイブリダイゼーション領域と標的DNAの相補配列とを含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対長の領域であり得る。一部の実施形態では、Rループ領域は、約20核酸塩基対長である。本明細書で使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解されたい。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対するものであってもよく、またはガイドRNAに対する相補鎖の反対側の鎖であるDNA鎖に対するものであってもよい。一部の実施形態では、Rループの領域における編集は、標的DNA配列におけるガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。
本明細書に記載の融合タンパク質は、正準塩基編集とは異なる編集ウィンドウにおける標的脱アミノ化をもたらすことができる。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約1~約20塩基上流にある。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約2~約12塩基上流にある。一部の実施形態では、標的核酸塩基は、約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対、PAM配列から離れているか、またはPAM配列の上流にある。一部の実施形態では、標的核酸塩基は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、もしくはそれ以上、PAM配列から離れているか、またはPAM配列の上流である。一部の実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流である。一部の実施形態では、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流である。
融合タンパク質は、複数の異種ポリペプチドを含むことができる。例えば、融合タンパク質は、1つ以上のUGIドメインおよび/または1つ以上の核局在化シグナルをさらに含むことができる。2つ以上の異種ドメインは、直列に挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbpにおいて直列ではないような位置に挿入され得る。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含むことができる。リンカーは、ペプチドまたは非ペプチドリンカーであってもよい。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであり得る。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、napDNAbpのN末端断片およびC末端断片は、リンカーでデアミナーゼに接続されている。一部の実施形態では、N末端断片およびC末端断片は、リンカーなしでデアミナーゼドメインに連結される。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。
一部の実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド(例えば、Cas12b/C2c1)またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのN末端断片またはC末端断片は、核酸プログラマブルDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは、剛性リンカー(rigid linker)である。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas12ポリペプチドのN末端断片およびC末端断片に隣接する異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法における塩基編集にも有用である。Cas12および1つ以上のデアミナーゼドメインを含む(例えば、アデノシンデアミナーゼ、またはCas12配列に隣接するアデノシンデアミナーゼドメインを含む)融合タンパク質は、標的配列の非常に特異的かつ効率的な塩基編集にも有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含む。一部の実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメインおよびシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼはCas12内で融合され、シチジンデアミナーゼは、C末端に融合される。一部の実施形態では、アデノシンデアミナーゼは、Cas12内で融合され、シチジンデアミナーゼは、N末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas12内で融合され、アデノシンデアミナーゼは、C末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas12内で融合され、アデノシンデアミナーゼは、N末端に融合される。アデノシンデアミナーゼおよびシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH、
NH-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。
様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8は、Cas12内で融合され、シチジンデアミナーゼは、C末端に融合される。一部の実施形態では、TadA*8は、Cas12内で融合され、シチジンデアミナーゼは、N末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas12内で融合され、TadA*8は、C末端に融合される。一部の実施形態では、シチジンデアミナーゼは、Cas12内で融合され、TadA*8は、N末端に融合される。TadA*8およびシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C、
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C、
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C、または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。
他の実施形態では、融合タンパク質は1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチド内に挿入されるか、またはCas12のN末端もしくはC末端で融合される。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチドのループ、αヘリックス領域、非構造化部分、または溶媒アクセス可能部分内に挿入される。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと、少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、もしくはAlicyclobacillus acidiphilus Cas12bの断片を含むか、または本質的にそれからなる。
他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位置153-154、255-256、306-307、980-981、1019-1020、534-535、604-605、もしくは344-345の間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、もしくは1044と1045との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二分核局在化シグナル)を含む。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする変異を含む。他の実施形態では、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A変異を含む。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
一部の実施形態では、融合タンパク質は、napDNAbpドメイン(例えば、Cas12由来ドメイン)を含み、内部融合核酸塩基編集ドメイン(例えば、デアミナーゼドメイン(例えば、アデノシンデアミナーゼドメイン)の全部または一部)を有する。一部の実施形態では、napDNAbpは、Cas12bである。一部の実施形態では、塩基エディターは、BhCas12bドメインを含み、以下の表10に提供される遺伝子座に挿入された内部融合TadA*8ドメインを有する。
非限定的な例として、アデノシンデアミナーゼ(例えば、TadA*8.13)をBhCas12bに挿入して、核酸配列を効果的に編集する融合タンパク質(例えば、TadA*8.13-BhCas12b)を生成することができる。
一部の実施形態では、本明細書に記載の塩基エディターシステムは、TadAがCas9に挿入されたABEである。TadAがCas9に挿入された関連するABEの配列が提供される。
101 Cas9 TadAins 1015
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
102 Cas9 TadAins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
103 Cas9 TadAins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
103 Cas9 TadAins 1040
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
105 Cas9 TadAins 1068
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDTGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
106 Cas9 TadAins 1247
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
107 Cas9 TadAins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
108 Cas9 TadAins 1026
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
109 Cas9 TadAins 768
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.1 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.2 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.3 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.4 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMRREDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAins 1249
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMRRPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAins Δ59-661250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSSGSETPGTSESATPESGSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.6 Cas9 TadAins 1251
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMRRDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.7 Cas9 TadAins 1252
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMRRNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.8 Cas9 TadAins Δ59-66 C-切断型1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.1 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.2 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSSGSETPGTSESATPESSGGSSIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
112 ΔHNH TadA
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
113 N-末端 単一TadAヘリックス切断型165-end
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
114 N-末端 単一TadA ヘリックス切断型165-end Δ59-65
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.1 Cas9 TadAins 1004
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.2 Cas9 TadAins 1005
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.3 Cas9 TadAins 1006
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQSEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.4 Cas9 TadAins 1007
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.1 Cas9 TadAins C-末端切断型2792
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.2 Cas9 TadAins C-末端切断型2791
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.3 Cas9 TadAins C-末端切断型2790
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQLGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
117 Cas9 Δ1017-1069
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
118 Cas9 TadA-CP116ins 1067
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
119 Cas9 TadAins 701
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
120 Cas9 TadACP136ins 1248
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
121 Cas9 TadACP136ins 1052
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLAMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
122 Cas9 TadACP136ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
123 Cas9 TadACP139ins 1299
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
124 Cas9 delta 792-872 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
125 Cas9 delta 792-906 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
126 TadA CP65ins 1003
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
127 TadA CP65ins 1016
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
128 TadA CP65ins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMITAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
129 TadA CP65ins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEITAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
130 TadA CP65ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
131 TadA CP65ins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
132 TadA CP65ins 1246
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
一部の実施形態では、アデノシンデアミナーゼ塩基エディターを生成して、TadAまたはそのバリアントを、特定された位置でCas9ポリペプチドに挿入した。
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/US2020/016285号および米国仮出願第62/852,228号および同第62/852,224号に記載されている(これらの内容は、その全体が参照により本明細書に援用される)。
AからGの編集
一部の実施形態では、本明細書に記載の塩基エディターは、アデノシンデアミナーゼドメインを含む融合タンパク質を含む。塩基エディターのかかるアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成の特性を示すイノシン(I)を形成することによって、アデニン(A)核酸塩基のグアニン(G)核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)のデオキシアデノシン残基のアデニンを脱アミノ化する(すなわち、アミン基を除去する)ことができる。
一部の実施形態では、本明細書に提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを一緒に融合することによって作製することができ、それによって、融合タンパク質が生成される。特定の実施形態では、本明細書に提供される融合タンパク質は、1つ以上の特徴を含み、融合タンパク質の塩基編集活性(例えば、効率、選択性、および特異性)を改善する。例えば、本明細書に提供される融合タンパク質は、減少したヌクレアーゼ活性を有するCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と称される二重鎖DNA分子の1つの鎖を切断するCas9ドメインを有し得る。いかなる特定の理論に拘束されることを望むものではないが、触媒残基(例えば、H840)の存在により、Cas9の活性が維持され、標的となるAとは反対のTを含む未編集(例えば、脱アミノ化されていない)鎖が切断される。Cas9の触媒残基の変異(例えば、D10からA10)により、標的となるA残基を含む編集鎖の切断が妨げられる。かかるCas9バリアントは、gRNAが規定する標的配列に基づいて、特定の位置で一本鎖DNA切断(ニック)を生成することができ、未編集鎖の修復をもたらし、最終的には、未編集鎖のTからCへの変化をもたらす。一部の実施形態では、AからGの(A-to-G)塩基エディターは、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子(UGI)ドメインまたは触媒不活性のイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論に拘束されることを望むものではないが、UGIドメインまたは触媒不活性イノシン特異的ヌクレアーゼは、脱アミノ化アデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、これは、塩基エディターの活性または効率を改善することができる。
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、およびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態では、塩基エディターに組み込まれるアデノシンデアミナーゼは、RNA(ADAR、例えば、ADAR1またはADAR2)に作用するアデノシンデアミナーゼの全部または一部を含む。別の実施形態では、塩基エディターに組み込まれるアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターは、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することもできる。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つ以上の変異を含むADATの全部または一部を含む。例えば、塩基エディターは、以下の変異のうちの1つ以上を含むEscherichia coli由来のADAT(EcTadA)の全部または一部を含むことができる:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する変異。
アデノシンデアミナーゼは、任意の好適な生物(例えば、E.coli)に由来し得る。一部の実施形態では、アデノシンデアミナーゼは、原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは、細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。一部の実施形態では、アデノシンデアミナーゼは、E.coli由来である。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供される変異(例えば、ecTadAにおける変異)のいずれかに対応する1つ以上の変異を含む、天然に存在するアデノシンデアミナーゼである。任意の相同タンパク質における対応する残基は、例えば、配列整列および相同残基の決定によって特定することができる。本明細書に記載の変異のいずれか(例えば、ecTadAにおいて特定された変異のいずれか)に対応する、任意の天然に存在するアデノシンデアミナーゼにおける(例えば、ecTadAと相同性を有する)変異は、それに応じて生成することができる。
アデノシンデアミナーゼ
一部の実施形態では、本発明の融合タンパク質は、1つ以上のアデノシンデアミナーゼドメインを含む。一部の実施形態では、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。一部の実施形態では、本発明に提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。アデノシンデアミナーゼは、任意の好適な生物(例えば、E.coli)に由来し得る。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供される変異(例えば、ecTadAにおける変異)のいずれかに対応する1つ以上の変異を含む、天然に存在するアデノシンデアミナーゼである。当業者は、例えば、配列整列および相同残基の決定によって、任意の相同タンパク質の対応する残基を特定することができるであろう。したがって、当業者であれば、本明細書に記載の変異のいずれか(例えば、ecTadAにおいて特定された変異のいずれか)に対応する、任意の天然に存在するアデノシンデアミナーゼにおける(例えば、ecTadAと相同性を有する)変異を生成することができるであろう。一部の実施形態では、アデノシンデアミナーゼは、原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは、細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。一部の実施形態では、アデノシンデアミナーゼは、E.coli由来である。
本発明は、効率(>50~60%)および特異性を向上させたアデノシンデアミナーゼのバリアントを提供する。特に、本明細書に記載のアデノシンデアミナーゼのバリアントは、ポリヌクレオチド内で所望の塩基を編集する可能性が高く、改変されることが意図されない塩基(すなわち、「バイスタンダー」)を編集する可能性が低い。
一部の実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。特定の実施形態では、TadAは、PCT/US2017/045381(WO2018/027078)に記載されるTadAのいずれか1つである(その全体が、参照により本明細書に援用される)。
野生型TadA(wt)アデノシンデアミナーゼは、以下の配列(TadA参照配列とも称される)を有する:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
一部の実施形態では、アデノシンデアミナーゼは、全長E.coli TadAデアミナーゼである。例えば、特定の実施形態では、アデノシンデアミナーゼは、以下のアミノ酸配列を有する:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD.
一部の実施形態では、アデノシンデアミナーゼは、原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは、細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli(E.coli)、Staphylococcus aureus(S.aureus)、Salmonella typhimurium(S.typhimurium)、Shewanella putrefaciens(S.putrefaciens)、Haemophilus influenzae(H.influenzae)、Caulobacter crescentus(C.crescentus)、Geobacter sulfurreducens(G.sulfurreducens)、またはBacillus subtilis由来である。一部の実施形態では、アデノシンデアミナーゼは、E.coli由来である。
しかしながら、本出願において有用な追加のアデノシンデアミナーゼが、当業者には明らかであり、本開示の範囲内であることを理解されたい。例えば、アデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のホモログであり得る。限定されないが、例示的なADATホモログのアミノ酸配列は、以下を含む:
Staphylococcus aureus(S.aureus)TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis(B.subtilis)TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium(S.typhimurium)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens(S.putrefaciens)TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031(H.influenzae)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus(C.crescentus)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens(G.sulfurreducens)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
E.Coli TadA(ecTadA)の一実施形態は、以下を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるアデノシンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
本明細書に提供される変異のいずれか(例えば、TadA参照配列に基づく)が、E.coli TadA(ecTadA)、S.aureus TadA(saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることを理解されたい。追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることは、当業者には明らかであろう。したがって、TadA参照配列において特定された変異のいずれかは、相同アミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)において作製され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。しかしながら、追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることを理解されたい。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、D147Y、TadA参照配列における変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。
一部の実施形態では、アデノシンデアミナーゼは、A106X、E155X、またはD147X、TadA参照配列における変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。一部の実施形態では、アデノシンデアミナーゼは、D147Yを含む。
本明細書に提供される変異のいずれか(例えば、TadA参照配列のecTadAアミノ酸配列に基づく)が、S.aureus TadA(saTadA)または他のアデノシンデアミナーゼ(例えば、細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることを理解されたい。当業者には、ecTadAにおける変異残基とどの程度相同であるかが明らかであろう。したがって、ecTadAにおいて特定された変異のいずれかは、相同アミノ酸残基を有する他のアデノシンデアミナーゼにおいて作製され得る。本明細書に提供される変異のいずれかは、ecTadAまたは別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。
例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/もしくはD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の変異群(変異群は、「;」によって分離される)、または別のアデノシンデアミナーゼにおける対応する変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N、A106V、およびE155V;D108N、A106V、およびD147Y;D108N、E155V、およびD147Y;A106V、E155V、およびD147Y;ならびにD108N、A106V、E155V、およびD147Y。しかしながら、本明細書に提供される対応する変異の任意の組み合わせが、アデノシンデアミナーゼ(例えば、ecTadA)において作製され得ることを理解されたい。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/もしくはK157Xの変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56EもしくはA56S、E59G、E85KもしくはE85G、M94L、I95L、V102A、F104L、A106V、R107CもしくはR107HもしくはR107P、D108GもしくはD108NもしくはD108VもしくはD108AもしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、および/もしくはN127Xの変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/もしくはN127S変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/もしくはT166Xの変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166Pのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
一部の実施形態では、アデノシンデアミナーゼは、H8X、A106X、およびD108Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、およびE155Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R126X、L68X、D108X、N127X、D147X、およびE155Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155G、およびQ163Hからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。
一部の実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、もしくはD108V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106VおよびD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107CおよびD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびQ154H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびN127S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Y、およびE155Vの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156X、および/もしくはK160Xの変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156F、および/もしくはK160S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異のうちの1つ以上を含む。
一部の実施形態では、アデノシンデアミナーゼは、L84X変異アデノシンデアミナーゼを含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、A106X、D108X、N127X、およびK160Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群から選択される1、2、3、4、5、または6つの変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、およびK160Sからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X、R26X、R107X、A142X、および/もしくはA143X変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、および/もしくはA143Rのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、もしくはE25Y変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、もしくはR107S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G変異、または別のアデノシンデアミナーゼ(例えばecTadA)の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、および/もしくはA143Rの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/もしくはK161Xの変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む(ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/もしくはK161Tの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37TもしくはN37S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48TもしくはP48L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51HもしくはR51L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146RもしくはS146C変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、もしくはP48A変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23RもしくはW23L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152PもしくはR52H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対する以下の変異の組み合わせを含む(ここで、組み合わせの各変異は、「_」によって区切られ、変異の各組み合わせは、括弧の間にある:
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat dead_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F)、(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F)、(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F、(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_I156F_K157N)。
一部の実施形態では、TadAデアミナーゼは、TadAバリアントである。一部の実施形態では、TadAバリアントは、TadA*7.10である。特定の実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA*7.10ドメインを含む。他の実施形態では、融合タンパク質は、ヘテロ二量体を形成することができるTadA*7.10およびTadA(wt)を含む。一実施形態では、本発明の融合タンパク質は、TadA*7.10に結合した野生型TadAを含み、これはCas9ニッカーゼに結合している。
一部の実施形態では、TadA*7.10は、少なくとも1つの改変を含む。一部の実施形態では、アデノシンデアミナーゼは、以下の配列における改変を含む:
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、TadA*7.10は、アミノ酸82および/または166における改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R。他の実施形態では、TadA*7.10のバリアントは、以下の群から選択される改変の組み合わせを含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R。
一部の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、欠失を含む。一部の実施形態では、アデノシンデアミナーゼのバリアントは、C末端の欠失を含む。特定の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10、TadA参照配列に対して、残基149、150、151、152、153、154、155、156、および157から始まるC末端の欠失、または別のTadAにおける対応する変異を含む。
他の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、以下の改変のうちの1つ以上を含む単量体である:TadA*7.10、TadA参照配列に対してY147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154R、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)は、以下の群から選択される改変の組み合わせを含む単量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むホモ二量体であり、各々、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を有する。他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含む単量体であり、各々、以下の群から選択される改変の組み合わせを有する:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
他の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10ドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
特定の実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメインと、Staphylococcus aureus(S.aureus)TadA、Bacillus subtilis(B.subtilis)TadA、Salmonella typhimurium(S.typhimurium)TadA、Shewanella putrefaciens(S.putrefaciens)TadA、Haemophilus influenzae F3031(H.influenzae)TadA、Caulobacter crescentus(C.crescentus)TadA、Geobacter sulfurreducens(G.sulfurreducens)TadA、またはTadA*7.10.から選択されるアデノシンデアミナーゼドメインとを含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなるTadA*8である。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、TadA*8は、切断型(truncated)である。一部の実施形態では、切断型TadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断型TadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼのバリアントは、全長TadA*8である。
一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
他の実施形態では、本開示の塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*8)単量体を含み、以下の改変のうちの1つ以上を含む:TadA*7.10、TadA参照配列に対してR26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166Iおよび/もしくはD167N、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)単量体は、以下の群から選択される改変の組み合わせを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、および/もしくはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインのヘテロ二量体と、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166Iおよび/もしくはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
一部の実施形態では、TadA*8は、表11に示されるバリアントである。表11は、TadAアミノ酸配列における特定のアミノ酸位置の番号、およびTadA-7.10アデノシンデアミナーゼにおけるそれらの位置に存在するアミノ酸を示す。また、表11は、M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-z(その内容全体が、参照により本明細書に援用される)に記載されているファージ支援非持続的進化(PANCE)およびファージ支援持続的進化(PACE)後のTadA-7.10に対するTadAバリアントのアミノ酸変化を示す。一部の実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。一部の実施形態では、TadA*8は、TadA*8eである。
一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、融合タンパク質は、TadA*8とTadA(wt)とを含み、これらは、ヘテロ二量体を形成することができる。
一部の実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるアデノシンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
特定の実施形態では、TadA*8は、太字で示される以下の位置のいずれかにおいて、1つ以上の変異を含む。他の実施形態では、TadA*8は、以下の下線で示される位置のいずれかにおいて、1つ以上の変異を含む:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG 50
LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG 100
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR 150
MPRQVFNAQK KAQSSTD
例えば、TadA*8は、TadA*7.10、TadA参照配列に対して、アミノ酸位置82および/もしくは166(例えば、V82S、T166R)単独での改変、または以下のY147T、Y147R、Q154S、Y123H、および/もしくはQ154Rのうちのいずれか1つ以上との組み合わせでの改変、あるいは別のTadAにおける対応する変異を含む。特定の実施形態では、改変の組み合わせは、以下の群から選択される:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
一部の実施形態では、アデノシンデアミナーゼは、TadA*8であり、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなる:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、TadA*8は、切断型(truncated)である。一部の実施形態では、切断型TadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断型TadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼのバリアントは、全長TadA*8である。
一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、塩基エディターは、TadA*8とTadA(wt)とを含み、ヘテロ二量体を形成することができる。
特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8を含む。一部の実施形態では、TadA*8は、Cas9ニッカーゼに連結される。一部の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結された野生型TadA(TadA(wt))を含む。他の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結されたTadA*7.10を含む。一部の実施形態では、塩基エディターは、TadA*8バリアント単量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA(wt)とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA*7.10とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8のヘテロ二量体を含むABE8である。一部の実施形態では、TadA*8は、表11、13、または14から選択される。一部の実施形態では、ABE8は、表13、14、または16から選択される。
一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントである。一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントであり、以下に記載されるバリアントから選択され、以下の配列(TadA*7.10と称される)を参照する:
一部の実施形態では、アデノシンデアミナーゼは、以下の改変のうちの1つ以上を含む:R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、およびA158K。1つ以上の変更が、下線および太字で上記の配列に示されている。
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:V82S+Q154R+Y147R、V82S+Q154R+Y123H、V82S+Q154R+Y147R+Y123H、Q154R+Y147R+Y123H+I76Y+V82S、V82S+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、Q154R+Y147R+Y123H+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、V82S+Q154R+Y147R、V82S+Q154R+Y147R、Q154R+Y147R+Y123H+I76Y、Q154R+Y147R+Y123H+I76Y+V82S、I76Y_V82S_Y123H_Y147R_Q154R、Y147R+Q154R+H123H、およびV82S+Q154R。
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:E25F+V82S+Y123H,T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、Q71M+V82S+Y123H+Y147R+Q154R、E25F+V82S+Y123H+T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、V82S+Y123H+P124W+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、R23H+V82S+Y123H+Y147R+Q154R、R21N+V82S+Y123H+Y147R+Q154R、V82S+Y123H+Y147R+Q154R+A158K、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、およびM70V+V82S+M94V+Y123H+Y147R+Q154R。
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:Q71M+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、およびV82S+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、M70V+V82S+M94V+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、およびM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。一部の実施形態では、アデノシンデアミナーゼは、単量体として発現される。他の実施形態では、アデノシンデアミナーゼは、ヘテロ二量体として発現される。一部の実施形態では、デアミナーゼまたは他のポリペプチド配列は、例えば、融合タンパク質の成分として含まれる場合、メチオニンを欠く。これにより、位置の番号付けが変化する場合がある。しかしながら、当業者は、かかる対応する変異が、同じ変異(例えば、Y73SおよびY72S、ならびにD139MおよびD138M)を指すことを理解するであろう。
一部の実施形態では、TadA*9バリアントは、本明細書に記載されるように、表17に記載の改変を含む。一部の実施形態では、TadA*9バリアントは、単量体である。一部の実施形態では、TadA*9バリアントは、野生型TadAアデノシンデアミナーゼを有するヘテロ二量体である。一部の実施形態では、TadA*9バリアントは、別のTadAバリアント(例えば、TadA*8、TadA*9)を有するヘテロ二量体である。TadA*9アデノシンデアミナーゼのさらなる詳細は、国際PCT出願第PCT/2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。
本明細書に提供される変異のいずれか、および(例えば、ecTadAアミノ酸配列に基づく)任意の追加の変異は、任意の他のアデノシンデアミナーゼに導入され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼ(例えば、ecTadA)において個別にまたは任意の組み合わせで作製され得る。
AからGの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)およびGaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature,551,464-471(2017)に記載されている(それらの内容全体が、参照により本明細書に援用される)。
CからTの編集
一部の実施形態では、本明細書に開示される塩基エディターは、シチジンデアミナーゼを含む融合タンパク質を含み、ポリヌクレオチドの標的シチジン(C)塩基を脱アミノ化して、チミンの塩基対形成の特性を有するウリジン(U)を生成することができる。一部の実施形態では、例えば、ポリヌクレオチドが二本鎖(例えば、DNA)である場合、ウリジン塩基は、次いで、(例えば、細胞の修復機構によって)チミジン塩基で置換されて、C:GからT:Aへの遷移が生じ得る。他の実施形態では、塩基エディターによる核酸のCからUへの脱アミノ化は、UからTへの置換を伴うことはできない。
Uを生じさせるためのポリヌクレオチドの標的Cの脱アミノ化は、塩基編集の種類の非限定的な例であり、本明細書に記載の塩基エディターによって実行され得る。別の例では、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン(C)塩基のグアニン(G)塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって産生されたポリヌクレオチドのUは、塩基除去修復機構によって(例えば、ウラシルDNAグリコシラーゼ(UDG)ドメインによって)ポリヌクレオチドから除去され、脱塩基部位を産生することができる。次いで、脱塩基部位と反対側の核酸塩基を、別の塩基(例えば、C)で、例えば、損傷乗り越え(translesion)ポリメラーゼによって(例えば、塩基修復機構によって)置換することができる。脱塩基部位と反対側の核酸塩基がCで置き換わることが典型的であるが、他の置換(例えば、A、GまたはT)も生じ得る。
したがって、一部の実施形態では、本明細書に記載の塩基エディターは、ポリヌクレオチドの標的CをUに脱アミノ化することができる脱アミノ化ドメイン(例えば、シチジンデアミナーゼドメイン)を含む。さらに、以下に記載されるように、塩基エディターは、一部の実施形態では、脱アミノ化から生じるUからTまたはUからGの変換を促進する追加のドメインを含み得る。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、TによるUの置換を媒介するウラシルグリコシラーゼ阻害因子(UGI)ドメインをさらに含み得、CからTの塩基編集事象を完了する。別の例では、損傷乗り越えポリメラーゼが、脱塩基部位と反対側のCの組み込みを促進することができる(すなわち、脱塩基部位でGの組み込みをもたらし、CからGの塩基性編集事象を完了する)ため、塩基エディターに、損傷乗り越えポリメラーゼを組み込んで、CからGの塩基編集の効率を向上させることができる。
ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNA、およびDNA-RNAハイブリッドを含む、任意のポリヌクレオチドの標的Cを脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の文脈に位置するC核酸塩基を触媒する。一部の実施形態では、標的Cを含むポリヌクレオチド全体が、一本鎖であり得る。例えば、塩基エディターに組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチドの標的Cを脱アミノ化することができる。他の実施形態では、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用し得るが、標的Cは、脱アミノ化反応時に一本鎖状態にあるポリヌクレオチドの一部に位置し得る。例えば、NAGPBドメインがCas9ドメインを含む実施形態では、いくつかのヌクレオチドは、Cas9-gRNA標的DNA複合体の形成中に不対のままであり得、Cas9の「R-ループ複合体」の形成をもたらす。これらの不対のヌクレオチドは、一本鎖DNAのバブル(bubble)を形成することができ、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えば、シチジンデアミナーゼ)の基質として機能することができる。
一部の実施形態では、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部または一部を含むことができる。APOBECは進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUの編集酵素である。APOBEC様タンパク質のN末端ドメインは、触媒ドメインであり、C末端ドメインは、偽触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(現在、「APOBEC3E」は、これを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導(シチジン)デアミナーゼが含まれる。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、活性化誘導デアミナーゼ(AID)の全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、シチジンデアミナーゼ1(CDA1)の全部または一部を含む。塩基エディターは、任意の好適な生物(例えば、ヒトまたはラット)由来のデアミナーゼを含み得ることを理解されたい。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス由来である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ラット(例えば、ラットAPOBEC1)に由来する。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒトAPOBEC1である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、pmCDA1である。
PmCDA1のアミノ酸配列および核酸配列を、以下に示す。
>tr|A5H718|A5H718_PETMA シトシンデアミナーゼ OS=Petromyzon marinus OX=7757 PE=2 SV=1アミノ酸配列:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
核酸配列:>EF094822.1 Petromyzon marinus単離菌 PmCDA.21シトシンデアミナーゼmRNA、完全長CDS:
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
ヒト活性化誘導シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を、以下に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN 活性化誘導シチジンデアミナーゼ OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV
ヒト活性化誘導シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を、以下に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN 活性化誘導シチジンデアミナーゼ OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV
核酸配列:>NG_011588.1:5001-15681 Homo sapiens活性化誘導シチジンデアミナーゼ(AICDA)、12番染色体上のRefSeqGene(LRG_17):
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGAC

TGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGAG

CAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
本開示の態様に従って、Cas9に融合され得る他の例示的なデアミナーゼを、以下に提供する。実施形態では、デアミナーゼは、活性化誘導デアミナーゼ(AID)である。一部の実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナルがないドメイン(核局在化配列、核輸送シグナルなし、細胞質局在化シグナル)が使用され得ることを理解されたい。
ヒトAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
マウスAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
イヌAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
ウシAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
ラットAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
clAID(Canis lupus familiaris):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
btAID(Bos Taurus):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
mAID(Mus musculus):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
rAPOBEC-1(Rattus norvegicus):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
maAPOBEC-1(Mesocricetus auratus):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI
ppAPOBEC-1(Pongo pygmaeus):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR
ocAPOBEC1(Oryctolagus cuniculus):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR
mdAPOBEC-1(Monodelphis domestica):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR
ppAPOBEC-2(Pongo pygmaeus):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
btAPOBEC-2(Bos Taurus):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
mAPOBEC-3-(1)(Mus musculus):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS
マウスAPOBEC-3-(2):
(斜体:核酸編集ドメイン)
ラットAPOBEC-3:
(斜体:核酸編集ドメイン)
hAPOBEC-3A(Homo sapiens):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN (
hAPOBEC-3F(Homo sapiens):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE
アカゲザルAPOBEC-3G:
MVEPMDPRTFVSNFNNRPILSGLNTVWLCCEVKTKDPSGPPLDAKIFQGKVYSKAKYHPEMRFLRWFHKWRQLHHDQEYKVTWYVSWSPCTRCANSVATFLAKDPKVTLTIFVARLYYFWKPDYQQALRILCQKRGGPHATMKIMNYNEFQDCWNKFVDGRGKPFKPRNNLPKHYTLLQATLGELLRHLMDPGTFTSNFNNKPWVSGQHETYLCYKVERLHNDTWVPLNQHRGFLRNQAPNIHGFPKGRHAELCFLDLIPFWKLDGQQYRVTCFTSWSPCFSCAQEMAKFISNNEHVSLCIFAARIYDDQGRYQEGLRALHRDGAKIAMMNYSEFEYCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAI
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
チンパンジーAPOBEC-3G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ミドリザルAPOBEC-3G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ヒトAPOBEC-3G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ヒトAPOBEC-3F:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3B:
(斜体:核酸編集ドメイン)
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
ウシAPOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
ヒトAPOBEC-3C:
(斜体:核酸編集ドメイン)
ゴリラAPOBEC-3C
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3A:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3A:
(斜体:核酸編集ドメイン)
ウシAPOBEC-3A:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3H:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
ヒトAPOBEC-3D:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ヤツメウナギCDA1(pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
ヒトAPOBEC3G A鎖 D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
hAPOBEC-4(Homo sapiens):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK
mAPOBEC-4(Mus musculus):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF
rAPOBEC-4(Rattus norvegicus):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV
mfAPOBEC-4(Macaca fascicularis):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK
pmCDA-1(Petromyzon marinus):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV
pmCDA-2(Petromyzon marinus):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP
pmCDA-5(Petromyzon marinus):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT
yCD(Saccharomyces cerevisiae):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE
rAPOBEC-1(Δ177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
rAPOBEC-1(Δ202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK
マウスAPOBEC-3:
(斜体:核酸編集ドメイン)
本開示の一部の態様は、例えば、デアミナーゼドメインにおける点変異を作製することによって、本明細書に記載の融合タンパク質のいずれかのデアミナーゼドメインの触媒活性を調節することが、融合タンパク質(例えば、塩基エディター)の処理性に影響するという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を低下させるが除去しない変異は、デアミナーゼドメインが標的残基に隣接する残基の脱アミノ化を触媒し、それによって、脱アミノ化のウィンドウを狭める可能性を低くすることができる。脱アミノ化のウィンドウを狭める能力は、特定の標的残基に隣接する残基の望ましくない脱アミノ化を防ぐことができ、オフターゲット効果を低減または防止することができる。
例えば、一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、およびR132X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R126A、R126E、R118A、W90A、W90Y、およびR132Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121RおよびH122R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR118A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126EおよびR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y、R126E、およびR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316RおよびD317R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのR320A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR313A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320EおよびR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、およびR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。
いくつかの修飾シチジンデアミナーゼが市販されており、これらに限定されないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3が挙げられ、これらは、Addgeneから入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。
CからTの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/US2016/058344号(WO2017/070632)およびKomor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)に記載されている(それらの内容全体が、参照により本明細書に援用される)。
シチジンデアミナーゼ
一部の実施形態では、本発明の融合タンパク質は、1つ以上のシチジンデアミナーゼドメインを含む。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンをウラシルまたはチミンに脱アミノすることができる。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、DNAのシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の好適な生物に由来し得る。一部の実施形態では、シチジンデアミナーゼは、本明細書に提供される変異のいずれかに対応する1つ以上の変異を含む、天然に存在するシチジンデアミナーゼである。当業者は、例えば、配列整列および相同残基の決定によって、任意の相同タンパク質の対応する残基を特定することができるであろう。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する任意の天然に存在するシチジンデアミナーゼにおける変異を生成することができるであろう。一部の実施形態では、シチジンデアミナーゼは、原核生物由来である。一部の実施形態では、シチジンデアミナーゼは、細菌由来である。一部の実施形態では、シチジンデアミナーゼは、哺乳動物(例えば、ヒト)由来である。
一部の実施形態では、シチジンデアミナーゼは、本明細書に記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるシチジンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。一部の実施形態は、任意の以前の態様または本明細書に記載のシチジンデアミナーゼ核酸塩基エディターポリペプチドをコードするポリヌクレオチド分子を提供する。一部の実施形態では、ポリヌクレオチドは、コドン最適化される。
本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、シチジンデアミナーゼは、参照配列または本明細書に提供されるシチジンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、シチジンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
本発明第2のタンパク質の融合タンパク質は、2つ以上の核酸編集ドメインを含む。一部の実施形態では、核酸編集ドメインは、CからUの塩基変化を触媒することができる。一部の実施形態では、核酸編集ドメインは、デアミナーゼドメインである。一部の実施形態では、デアミナーゼは、シチジンデアミナーゼである。一部の実施形態では、デアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーのデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC1デアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC2デアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3デアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Aデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Bデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Cデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Dデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Eデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Fデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Gデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC3Hデアミナーゼである。一部の実施形態では、デアミナーゼは、APOBEC4デアミナーゼである。一部の実施形態では、デアミナーゼは、活性化誘導デアミナーゼ(AID)である。一部の実施形態では、デアミナーゼは、脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼは、無脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスのデアミナーゼである。一部の実施形態では、デアミナーゼは、ヒトデアミナーゼである。一部の実施形態では、デアミナーゼは、ラットデアミナーゼ(例えば、rAPOBEC1)である。一部の実施形態では、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ1(pmCDA1)である。一部の実施形態では、デアミナーゼは、ヒトAPOBEC3Gである。一部の実施形態では、デアミナーゼは、ヒトAPOBEC3Gの断片である。一部の実施形態では、デアミナーゼは、ヒトAPOBEC3Gバリアントであり、D316R D317R変異を含む。一部の実施形態では、デアミナーゼは、ヒトAPOBEC3Gの断片であり、D316R D317R変異に対応する変異を含む。一部の実施形態では、核酸編集ドメインは、本明細書に記載の任意のデアミナーゼのデアミナーゼドメインと、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一である。
特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質のいずれかは、減少したヌクレアーゼ活性を有するCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、または二本鎖DNA分子の1つの鎖を切断するCas9ドメイン(Cas9ニッカーゼ(nCas9)と称される)を有し得る。
高忠実度Cas9ドメイン
本開示の一部の態様は、高忠実度Cas9ドメインを提供する。一部の実施形態では、高忠実度Cas9ドメインは、操作されたCas9ドメインであり、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を減少させる1つ以上の変異を含む。任意の特定の理論に拘束されることを望むものではないが、高忠実度Cas9ドメインは、DNAの糖-リン酸骨格との静電相互作用が減少しており、より少ないオフターゲット効果を有し得る。一部の実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸骨格との間の会合を減少させる1つ以上の変異を含む。一部の実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸骨格との間の会合を、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる1つ以上の変異を含む。
一部の実施形態では、本明細書に提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/もしくはQ926X変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、本明細書に提供されるCas9融合タンパク質のいずれかは、本明細書に提供されるアミノ酸配列のいずれかにおけるN497A、R661A、Q695A、および/もしくはQ926A変異、または対応する変異のうちの1つ以上を含む。一部の実施形態では、Cas9ドメインは、D10A変異、または本明細書に提供されるアミノ酸配列のいずれにおける対応する変異を含む。高い忠実度を有するCas9ドメインは、当該技術分野で既知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメインは、Kleinstiver,B.P.,et al.“High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.”Nature 529,490-495(2016);and Slaymaker,I.M.,et al.“Rationally engineered Cas9 nucleases with improved specificity.”Science 351,84-88(2015)に記載されている(各々の内容全体が、参照により本明細書に援用される)。
一部の実施形態では、修飾Cas9は、高忠実度Cas9酵素である。一部の実施形態では、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または超正確Cas9バリアント(HypaCas9)である。修飾Cas9 eSpCas9(1.1)は、HNH/RuvCグルーブ(groove)と非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、鎖の分離を防止し、オフターゲット部位での切断を防止する。同様に、SpCas9-HF1は、Cas9とDNAリン酸骨格との相互作用を破壊するアラニン置換を介してオフターゲット編集を低下させる。HypaCas9は、REC3ドメイン内に、Cas9プルーフリーディングおよび標的識別を高める変異(SpCas9 N692A/M694A/Q695A/H698A)を含む。3つすべての高忠実度酵素は、野生型Cas9よりも少ないオフターゲット編集を生成する。
例示的な高忠実度Cas9を、以下に提供する。Cas9に対する高忠実度Cas9ドメインの変異を、太字および下線で示す。
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
napDNAbpと、シチジンデアミナーゼおよび/またはアデノシンデアミナーゼとを含む融合タンパク質
本開示の一部の態様は、Cas9ドメインまたは他の核酸プログラマブルDNA結合タンパク質(例えば、Cas12)、および1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼドメイン、および/またはDNAグリコシラーゼドメインを含む融合タンパク質を提供する。Cas9ドメインは、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれであり得ることを理解されたい。一部の実施形態では、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼおよび/またはアデノシンデアミナーゼのうちのいずれかと融合され得る。本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。
一部の実施形態では、融合タンパク質は、以下のドメインA~C、A~D、またはA~Eを含み:
NH-[A-B-C]-COOH、
NH-[A-B-C-D]-COOH、または
NH-[A-B-C-D-E]-COOH、
式中、AおよびC、またはA、C、およびEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
DNAグリコシラーゼドメインまたはその活性断片、
式中、B、またはBおよびDは、各々、核酸配列特異的結合活性を有する1つ以上のドメインを含む。
一部の実施形態では、融合タンパク質は、以下の構造を含み:
NH-[A-B-C]-COOH;
NH-[A-B-C-D]-COOH、または
NH-[A-B-C-D-E]-COOH、
式中、AおよびC、またはA、C、およびEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
DNAグリコシラーゼドメインまたはその活性断片、
式中、nは整数:1、2、3、4、または5であり、pは、整数:0、1、2、3、4、または5であり、qは、整数:0、1、2、3、4、または5であり、式中、B、またはBおよびDは、各々、核酸配列特異的結合活性を有するドメインを含み、式中、oは、整数:1、2、3、4、または5である。
例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
一部の実施形態では、本明細書に提供されるCas12ドメインまたはCas12タンパク質のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼまたはアデノシンデアミナーゼのうちのいずれかと融合され得る。例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH-[Cas12ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH-[Cas12ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH-[TadA*8]-[Cas9ドメイン]-COOH、
NH-[Cas9ドメイン]-[TadA*8]-COOH、
NH-[TadA*8]-[Cas12ドメイン]-COOH、または
NH-[Cas12ドメイン]-[TadA*8]-COOH。
一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8と、シチジンデアミナーゼおよび/またはアデノシンデアミナーゼとを含む。一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
例示的な融合タンパク質の構造としては、以下が挙げられる:
NH-[TadA*8]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH、
NH-[TadA*8]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH。
一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*9と、シチジンデアミナーゼおよび/またはアデノシンデアミナーゼとを含む。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH-[TadA*9]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH、
NH-[TadA*9]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH。
一部の実施形態では、融合タンパク質は、N末端断片に隣接するデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するシチジンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するアデノシンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。
一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12ドメイン)とを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、リンカーは、シチジンデアミナーゼまたはアデノシンデアミナーゼとnapDNAbpとの間に存在する。一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。
本開示の融合タンパク質は、1つ以上の追加の特徴を含み得ることを理解されたい。例えば、一部の実施形態では、融合タンパク質は、阻害因子、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含んでもよい。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。さらなる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/2017/044935号、第PCT/US2019/044935号、および第PCT/US2020/016288号に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。
核局在化配列(NLS)を含む融合タンパク質
一部の実施形態では、本明細書に提供される融合タンパク質は、1つまたは複数の(例えば、2、3、4、5)核標的化配列、例えば、核局在化配列(NLS)をさらに含む。一実施形態では、二分NLSが使用される。一部の実施形態では、NLSは、(例えば、核内輸送によって)細胞核へのNLSを含むタンパク質の移入を促進するアミノ酸配列を含む。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、核局在化配列(NLS)をさらに含む。一部の実施形態では、NLSは、融合タンパク質のN末端に融合される。一部の実施形態では、NLSは、融合タンパク質のC末端に融合される。一部の実施形態では、NLSは、Cas9ドメインのN末端に融合される。一部の実施形態では、NLSは、Cas9ドメインのC末端に融合される。一部の実施形態では、NLSは、nCas9ドメインまたはdCas9ドメインのC末端に融合される。一部の実施形態では、NLSは、Cas12ドメインのN末端に融合される。一部の実施形態では、NLSは、Cas12ドメインのC末端に融合される。一部の実施形態では、NLSは、シチジンデアミナーゼまたはアデノシンデアミナーゼのN末端に融合される。一部の実施形態では、NLSは、シチジンデアミナーゼまたはアデノシンデアミナーゼのC末端に融合される。一部の実施形態では、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。一部の実施形態では、NLSは、リンカーなしで融合タンパク質に融合される。一部の実施形態では、NLSは、本明細書で提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は、当該技術分野で既知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al.,PCT/EP2000/011690に記載されている(それらの内容は、例示的な核局在化配列の開示のために、参照により本明細書に援用される)。一部の実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼ、Cas9ドメイン、およびNLSを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、ドメインまたはタンパク質(例えば、シチジンデアミナーゼもしくはアデノシンデアミナーゼ、Cas9ドメイン、またはNLS)のうちの1つ以上の間に、リンカー配列が存在する。一部の実施形態では、リンカーは、シチジンデアミナーゼおよびアデノシンデアミナーゼドメインと、napDNAbpとの間に存在する。一部の実施形態では、以下の一般的なアーキテクチャで使用される「-」は、任意のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼおよびアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼおよびアデノシンデアミナーゼと、napDNAbpとが、本明細書に提供されるリンカーのいずれかを介して融合される。
一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12)ドメインとを有する例示的なnapDNAbp(例えば、Cas9またはCas12)融合タンパク質の一般的アーキテクチャは、以下の構造のいずれか1つを含む。ここで、NLSは、核局在化配列(例えば、本明細書に提供される任意のNLS)であり、NHは、融合タンパク質のN末端であり、COOHは、融合タンパク質のC末端である:
NH-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH-NLS[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH-NLS[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH-NLS-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、
NH-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH、
NH-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH、または
NH-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。一部の実施形態では、NLSは、例えば、本明細書に記載されるように、リンカー内に存在するか、またはNLSは、リンカーに隣接している。二分NLSは、2つの塩基性アミノ酸クラスターを含み、比較的短いスペーサー配列によって分離されている(したがって、二分(bipartite)-2つの部分であり、一方、一分(monopartite)NLSはそうではない)。ヌクレオプラズミンのNLS、KR[PAATKKAGQA]KKKKは、約10アミノ酸のスペーサーによって分離された2つのクラスターの塩基性アミノ酸という、普遍的な二分シグナルのプロトタイプである。例示的な二分NLSの配列は、以下のとおりである:
PKKKRKVEGADKRTADGSEFESPKKKRKV
1つ以上の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを使用することができる。例えば、1、2、3、4、5、6、7、8、9、10個、または約1、2、3、4、5、6、7、8、9、10個のNLSが使用され得る。CRISPR酵素は、アミノ末端もしくはその近くにNLSを含むか、カルボキシ末端もしくはその近くに約1、2、3、4、5、6、7、8、9、10個もしくは約1、2、3、4、5、6、7、8、9、10個以上のNLSを含むか、またはそれらの任意の組み合わせのNLS(例えば、アミノ末端に1つ以上のNLS、およびカルボキシ末端に1つ以上のNLS)を含むことができる。複数のNLSが存在する場合、単一のNLSが複数のコピーに存在し得るように、かつ/または1つ以上の他のNLSとの組み合わせで1つ以上のコピーに存在し得るように、各々が、他とは独立して選択され得る。
本方法で使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSは、NLSに最も近いアミノ酸が、N末端またはC末端から、ポリペプチド鎖に沿って、約50アミノ酸以内(例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内)にある場合、N末端またはC末端付近とみなされる。
追加のドメイン
本明細書に記載の塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進するのを助ける任意のドメインを含むことができる。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、および1つ以上の追加のドメインを含む。一部の実施形態では、追加のドメインは、塩基エディターの酵素機能もしくは触媒機能、塩基エディターの結合機能を促進させ得るか、または所望の塩基編集結果を妨げ得る細胞機構(例えば、酵素)の阻害因子であり得る。一部の実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写活性化因子、または転写リプレッサードメインを含むことができる。
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害因子(UGI)ドメインを含むことができる。一部の実施形態では、U:Gヘテロ二重鎖DNAの存在に対する細胞のDNA修復応答は、細胞における核酸塩基編集効率の低下の原因となり得る。かかる実施形態では、ウラシルDNAグリコシラーゼ(UDG)は、細胞のDNAからのUの除去を触媒することができ、塩基除去修復(BER)を開始して、主に、U:G対からC:G対への復帰をもたらすことができる。かかる実施形態では、BERは、一本鎖に結合し、編集された塩基をブロックし、UGIを阻害し、BERを阻害し、編集された塩基を保護し、かつ/または編集されていない鎖の修復を促進する、1つ以上のドメインを含む塩基エディターで阻害され得る。したがって、本開示は、UGIドメインを含む塩基エディター融合タンパク質を企図する。
一部の実施形態では、塩基エディターは、ドメインとして、二本鎖切断(DSB)結合タンパク質の全部または一部を含む。例えば、DSB結合タンパク質は、DSBの末端に結合し、それらを分解から保護することができるバクテリオファージMuのGamタンパク質を含むことができる。Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい(その内容全体が、参照により本明細書に援用される)。
加えて、一部の実施形態では、Gamタンパク質は、塩基エディターのN末端に融合され得る。一部の実施形態では、Gamタンパク質は、塩基エディターのC末端に融合され得る。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。一部の実施形態では、DSBの遊離末端に結合するGamを使用して、塩基編集のプロセス中のインデルの形成を低減することができる。一部の実施形態では、174残基のGamタンパク質が、塩基エディターのN末端に融合される。Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい。一部の実施形態では、変異(複数可)は、野生型ドメインに対して、塩基エディタードメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを減少させ得る。別の場合、変異(複数可)は、野生型ドメインに対して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換は、塩基エディターの長さを変化させない。
すべてのドメインの長さが野生型ドメインと同じである場合、かかる塩基エディターの非限定的な例としては、以下が挙げられる:
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH。
塩基エディターシステム
塩基エディターシステムを使用して核酸塩基を編集するためのシステム、組成物、および方法が本明細書に提供される。一部の実施形態では、塩基エディターシステムは、(1)塩基エディター(BE)であって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインおよび核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む、塩基エディターと、(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと併せてガイドポリヌクレオチド(例えば、ガイドRNA)と、を含む。一部の実施形態では、塩基エディターシステムは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターシステムは、アデノシン塩基エディター(ABE)である。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインである。一部の実施形態では、デアミナーゼドメインは、シチジンデアミナーゼまたはシトシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。一部の実施形態では、アデノシン塩基エディターは、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNAのシチジンを脱アミノ化することができる。
一部の実施形態では、本明細書に提供される塩基エディターシステムは、ゲノム編集に対する新たなアプローチを提供し、触媒的に欠陥のあるStreptococcus pyogenes Cas9、デアミナーゼ(例えば、シチジンまたはアデノシンデアミナーゼ)、および塩基除去修復の阻害因子を含む融合タンパク質を使用して、二本鎖DNA切断を生成することなく、ドナーDNA鋳型を必要とせず、また、過剰な確率的な挿入および欠失を誘発することなく、DNAにおけるプログラマブルな一本鎖ヌクレオチド変化(CからTまたはAからG)を誘発する。
核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)および第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、およびKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)も参照されたい(それらの内容全体が、参照により本明細書に援用される)。
本明細書に提供される塩基エディターシステムの使用は、(a)対象のポリヌクレオチド(例えば、二本鎖もしくは一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)とガイドポリ核酸(例えば、gRNA)とを含む塩基エディターシステムと接触させるステップであって、標的ヌクレオチド配列が、標的核酸塩基対を含む、接触させるステップと、(b)当該標的領域の鎖分離を誘導するステップと、(c)標的領域の一本鎖における当該標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換するステップと、(d)当該標的領域の1つ以下の鎖を切断するステップであって、第1の核酸塩基塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基によって置き換えられる、切断するステップと、を含む。一部の実施形態では、ステップ(b)が省略されることを理解されたい。一部の実施形態では、当該標的核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。一部の実施形態では、本発明に提供される塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集(multiplex editing)が可能である。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
一部の実施形態では、カットされた一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズする。一部の実施形態では、カットされた一本鎖は、第1の核酸塩基を含む鎖と反対側である。一部の実施形態では、塩基エディターは、Cas9ドメインを含む。一部の実施形態では、第1の塩基は、アデニンであり、第2の塩基は、G、C、A、またはTではない。一部の実施形態では、第2の塩基は、イノシンである。
一部の実施形態では、シングルガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的指向化してもよい。一部の実施形態では、一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的指向化してもよい。
塩基エディターシステムの核酸塩基成分およびポリヌクレオチドプログラマブルヌクレオチド結合成分は、互いに共有結合的または非共有結合的に会合することができる。例えば、一部の実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するか、またはデアミナーゼドメインと会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、核酸塩基編集成分(例えば、デアミナーゼ成分)は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分もしくは異種ドメインと相互作用し得るか、会合し得るか、または複合体を形成し得る追加の異種部分または異種ドメインを含むことができる。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含んでもよい。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。一部の実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、塩基エディターシステムの核酸塩基編集成分(例えば、デアミナーゼ成分)は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターシステムは、塩基除去修復(BER)成分の阻害因子をさらに含み得る。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。BER成分の阻害因子は、塩基除去修復阻害因子を含んでもよい。一部の実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)であり得る。一部の実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得る。一部の実施形態では、塩基除去修復の阻害因子は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有結合的に相互作用するか、または塩基除去修復の阻害因子と会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、塩基除去修復成分の阻害因子は、追加の異種部分または異種ドメインを含むことができ、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分または異種ドメインと相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、塩基除去修復の阻害因子は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、ガイドポリヌクレオチドの追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターは、編集された鎖の塩基除去修復(BER)を阻害する。一部の実施形態では、塩基エディターは、未編集鎖を保護または結合する。一部の実施形態では、塩基エディターは、UGI活性を含む。一部の実施形態では、塩基エディターは、触媒不活性イノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、塩基対の意図される編集は、PAM部位の上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の下流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。
一部の実施形態では、本方法は、正準(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。一部の実施形態では、リンカーまたはスペーサーは、1~25アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、5~20アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。
一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあり得る。一部の実施形態では、かかる定義された標的領域は、PAMの約15塩基上流にあり得る。Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、およびKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい(それらの内容全体が、参照により本明細書に援用される)。
一部の実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。一部の実施形態では、塩基対の意図される編集は、標的ウィンドウ内にある。一部の実施形態では、標的ウィンドウは、塩基対の意図された編集を含む。一部の実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを使用して実施される。一部の実施形態では、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラマブルヌクレオチド結合ドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのC末端に局在する。
本明細書に開示される塩基エディターに存在し得る他の例示的な特徴は、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグなどの局在化配列である。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。さらなる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
一部の実施形態では、非限定的な例示的なシチジン塩基エディター(CBE)は、BE1(APOBEC1-XTEN-dCas9)、BE2(APOBEC1-XTEN-dCas9-UGI)、BE3(APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamを含む。BE4は、32アミノ酸のAPOBEC1-Cas9n(D10A)リンカーおよび9アミノ酸のCas9n-UGIリンカーが延び、UGIの第2のコピーが、別の9アミノ酸のリンカーとともに、構築物のC末端に付加されて、単一の塩基エディター構築物になる。塩基エディターであるsaBE3およびsaBE4は、より小さいS.aureus Cas9n(D10A)で置き換えられたS.aureus Cas9n(D10A)を有する。BE3-Gam、saBE3-Gam、BE4-Gam、およびsaBE4-Gamは、16アミノ酸XTENリンカーを介して、BE3、saBE3、BE4、およびsaBE4のN末端に融合された174残基のGamタンパク質を有する。
一部の実施形態では、アデノシン塩基エディター(ABE)は、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、ABEは、BE3のAPOBEC1成分を、天然または操作されたE.coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成される。一部の実施形態では、ABEは、進化したTadAバリアントを含む。一部の実施形態では、ABEは、ABE1.2(TadA*-XTEN-nCas9-NLS)である。一部の実施形態では、TadA*は、A106VおよびD108N変異を含む。
一部の実施形態では、ABEは、第2世代のABEである。一部の実施形態では、ABEは、ABE2.1であり、TadA*(TadA*2.1)における追加の変異D147YおよびE155Vを含む。一部の実施形態では、ABEは、ABE2.2であり、触媒不活性化バージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を有するAAG)に融合されたABE2.1である。一部の実施形態では、ABEは、ABE2.3であり、触媒不活性化(D35A変異による不活性化)バージョンのE.coli EndoVに融合された、ABE2.1である。一部の実施形態では、ABEは、ABE2.6であり、ABE2.1のリンカーの2倍の長さのリンカー(32アミノ酸、(SGGS)-XTEN-(SGGS))を有する。一部の実施形態では、ABEは、ABE2.7であり、追加の野生型TadA単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.8であり、追加のTadA*2.1単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.9であり、進化したTadA(TadA*2.1)のABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.10であり、野生型TadAのABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.11であり、TadA*単量体のN末端に不活性化E59A変異を有するABE2.9である。一部の実施形態では、ABEは、ABE2.12であり、TadA*単量体の内部に不活性化E59A変異を有するABE2.9である。
一部の実施形態では、ABEは、第3世代のABEである。一部の実施形態では、ABEは、ABE3.1であり、3つの追加のTadA変異(L84F、H123Y、およびI156F)を有するABE2.3である。
一部の実施形態では、ABEは、第4世代のABEである。一部の実施形態では、ABEは、ABE4.3であり、追加のTadA変異A142N(TadA*4.3)を有するABE3.1である。
一部の実施形態では、ABEは、第5世代のABEである。一部の実施形態では、ABEは、ABE5.1であり、生存クローンからのコンセンサスセットの変異(H36L、R51L、S146C、およびK157N)をABE3.1に移入することによって生成される。一部の実施形態では、ABEは、ABE5.3であり、進化したTadA*の内部に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABEは、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14であり、以下の表12に示される。一部の実施形態では、ABEは、第6世代のABEである。一部の実施形態では、ABEは、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6であり、以下の表12に示される。一部の実施形態では、ABEは、第7世代のABEである。一部の実施形態では、ABEは、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10であり、以下の表12に示される。
一部の実施形態では、塩基エディターは、第8世代のABE(ABE8)である。一部の実施形態では、ABE8は、TadA*8バリアントを含む。一部の実施形態では、ABE8は、TadA*8バリアントを含む単量体構築物(「ABE8.x-m」)を有する。一部の実施形態では、ABE8は、ABE8.1-mであり、Y147T変異を有するTadA*7.10(TadA*8.1)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-mであり、Y147R変異を有するTadA*7.10(TadA*8.2)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-mであり、Q154S変異(TadA*8.3)を有するTadA*7.10を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-mであり、Y123H変異を有するTadA*7.10(TadA*8.4)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-mであり、V82S変異を有するTadA*7.10(TadA*8.5)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-mであり、T166R変異を有するTadA*7.10(TadA*8.6)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-mであり、Q154R変異を有するTadA*7.10(TadA*8.7)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-mであり、Y147R、Q154R、およびY123H変異を有するTadA*7.10(TadA*8.8)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-mであり、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.9)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-mであり、Y147R、Q154R、およびT166R変異を有するTadA*7.10(TadA*8.10)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-mであり、Y147TおよびQ154R変異を有するTadA*7.10(TadA*8.11)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-mであり、Y147TおよびQ154S変異を有するTadA*7.10(TadA*8.12)を含む単量体構築物を有する。
一部の実施形態では、ABE8は、ABE8.13-mであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.13)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-mであり、I76YおよびV82S変異を有するTadA*7.10(TadA*8.14)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-mであり、V82SおよびY147R変異を有するTadA*7.10(TadA*8.15)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-mであり、V82S、Y123H(H123Yから復帰したY123H)、およびY147R変異を有するTadA*7.10(TadA*8.16)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-mであり、V82SおよびQ154R変異を有するTadA*7.10(TadA*8.17)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-mであり、V82S、Y123H(H123Yから復帰したY123H)、およびQ154R変異を有するTadA*7.10(TadA*8.18)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.19-mであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.19)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.20-mであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.20)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-mであり、Y147RおよびQ154S変異を有するTadA*7.10(TadA*8.21)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-mであり、V82SおよびQ154S変異を有するTadA*7.10(TadA*8.22)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-mであり、V82SおよびY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-mであり、V82S、Y123H(H123Yから復帰したY123H)、およびY147T変異を有するTadA*7.10(TadA*8.24)を含む単量体構築物を有する。
一部の実施形態では、ABE8は、TadA*8バリアントに融合された野生型E.coli TadAを含むヘテロ二量体構築物(「ABE8.x-d」)を有する。一部の実施形態では、ABE8は、ABE8.1-dであり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-dであり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-dであり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-dであり、Y123H変異を有するTadA*7.10(TadA*8.4)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-dであり、V82S変異を有するTadA*7.10(TadA*8.5)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-dであり、T166R変異を有するTadA*7.10(TadA*8.6)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-dであり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-dであり、Y147R、Q154R、およびY123H変異を有するTadA*7.10(TadA*8.8)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-dであり、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.9)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-dであり、Y147R、Q154R、およびT166R変異を有するTadA*7.10(TadA*8.10)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-dであり、Y147TおよびQ154R変異を有するTadA*7.10(TadA*8.11)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-dであり、Y147TおよびQ154S変異を有するTadA*7.10(TadA*8.12)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.13-dであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.13)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-dであり、I76YおよびV82S変異を有するTadA*7.10(TadA*8.14)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-dであり、V82SおよびY147R変異を有するTadA*7.10(TadA*8.15)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-dであり、V82S、Y123H(H123Yから復帰したY123H)、およびY147R変異を有するTadA*7.10(TadA*8.16)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-dであり、V82SおよびQ154R変異を有するTadA*7.10(TadA*8.17)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-dであり、V82S、Y123H(H123Yから復帰したY123H)、およびQ154R変異を有するTadA*7.10(TadA*8.18)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.19-dであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.19)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.20-dであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.20)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-dであり、Y147RおよびQ154S変異を有するTadA*7.10(TadA*8.21)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-dであり、V82SおよびQ154S変異を有するTadA*7.10(TadA*8.22)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-dであり、V82SおよびY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-dであり、V82S、Y123H(H123Yから復帰したY123H)、およびY147T変異を有するTadA*7.10(TadA*8.24)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。
一部の実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含むヘテロ二量体構築物(「ABE8.x-7」)を有する。一部の実施形態では、ABE8は、ABE8.1-7であり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-7であり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-7であり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-7であり、Y123H変異を有するTadA*7.10に融合されたTadA*7.10(TadA*8.4)を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-7であり、V82S変異を有するTadA*7.10(TadA*8.5)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-7であり、T166R変異を有するTadA*7.10(TadA*8.6)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-7であり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-7であり、Y147R、Q154R、およびY123H変異を有するTadA*7.10(TadA*8.8)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-7であり、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.9)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-7であり、Y147R、Q154R、およびT166R変異を有するTadA*7.10(TadA*8.10)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-7であり、Y147TおよびQ154R変異を有するTadA*7.10(TadA*8.11)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-7であり、Y147TおよびQ154S変異を有するTadA*7.10(TadA*8.12)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.13-7であり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、およびI76Y変異を有するTadA*7.10(TadA*8.13)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-7であり、I76Y、およびV82S変異を有するTadA*7.10(TadA*8.14)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-7であり、V82S、およびY147R変異を有するTadA*7.10(TadA*8.15)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-7であり、V82S、Y123H(H123Yから復帰したY123H)、およびY147R変異を有するTadA*7.10(TadA*8.16)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-7であり、V82SおよびQ154R変異を有するTadA*7.10(TadA*8.17)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-7であり、V82S、Y123H(H123Yから復帰したY123H)、およびQ154R変異を有するTadA*7.10(TadA*8.18)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.19-7であり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.19)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.20-7であり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、およびQ154R変異を有するTadA*7.10(TadA*8.20)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-7であり、Y147RおよびQ154S変異を有するTadA*7.10(TadA*8.21)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-7であり、V82SおよびQ154S変異を有するTadA*7.10(TadA*8.22)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-7であり、V82SおよびY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-7であり、V82S、Y123H(H123Yから復帰したY123H)、およびY147T変異を有するTadA*7.10(TadA*8.24)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。
一部の実施形態では、ABEは、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dであり、以下の表13に示されている。
一部の実施形態では、ABE8は、ABE8a-mであり、R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8a)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-mであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8b)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-mであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8c)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-mであり、V88A、T111R、D119N、およびF149Y変異を有するTadA*7.10(TadA*8d)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-mであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8e)を含む単量体構築物を有する。
一部の実施形態では、ABE8は、ABE8a-dであり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8a)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-dであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167Nの変異を有するTadA*7.10(TadA*8b)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-dであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8c)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-dであり、V88A、T111R、D119N、およびF149Y変異を有するTadA*7.10(TadA*8d)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-dであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8e)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。
一部の実施形態では、ABE8は、ABE8a-7であり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8a)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-7であり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8b)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-7であり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8c)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-7であり、V88A、T111R、D119N、およびF149Y変異を有するTadA*7.10(TadA*8d)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-7であり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異を有するTadA*7.10(TadA*8e)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。
一部の実施形態では、ABEは、ABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d、またはABE8e-dであり、以下の表14に示される。一部の実施形態では、ABEは、ABE8e-mまたはABE8e-dである。ABE8eは、SpCas9以外のCasホモログ(例えば、SaCas9、SaCas9-KKH、Cas12aホモログ(例えば、LbCas12a、enAs-Cas12a)、SpCas9-NG、および円順列変異体CP1028-SpCas9およびCP1041-SpCas9)とともに使用した場合、効率的なアデニン塩基編集活性および低いインデル形成を示す。表14に示されるABE8eの変異に加えて、TadAドメインにV106W置換を導入することによって、オフターゲットのRNA編集およびDNA編集が低減された(M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-zに記載されている。その内容全体が、参照により本明細書に援用される)。
一部の実施形態では、塩基エディター(例えば、ABE8)は、アデノシンデアミナーゼのバリアント(例えば、TadA*8)を、円順列変異体Cas9(例えば、CP5またはCP6)および二部核局在化配列を含む足場内にクローニングすることによって生成される。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAMCP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAMCP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGAPAM CP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。
一部の実施形態では、ABEは、以下の表15に示される遺伝子型を有する。

以下の表16に示されるように、40個のABE8の遺伝子型が記載されている。進化したE.coli TadA部分のABEの残基位置を示す。ABE7.10変異とは異なる場合に、ABE8の変異変化が示される。一部の実施形態では、ABEは、以下の表16に示されるABEのうちの1つの遺伝子型を有する。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.1である:
ABE8.1_Y147T_CP5_NGC PAM_単量体
上記の配列において、平文(plain text)は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.1である:
pNMG-B335ABE8.1_Y147T_CP5_NGC PAM_単量体
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.14である:
NGC PAM CP5を使用したpNMG-357_ABE8.14
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.8-mである:
ABE8.8-m
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.8-dである:
ABE8.8-d
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.13-mである:
ABE8.13-m
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.13-dである:
ABE8.13-d
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.17-mである:
ABE8.17-m
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.17-dである:
ABE8.17-d
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.20-mである:
ABE8.20-m
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.20-dである:
ABE8.20-d
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示し、二重下線の配列は、変異を示す。
一部の実施形態では、本発明のABE8は、以下の配列から選択される:
01.monoABE8.1_bpNLS+Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02.monoABE8.1_bpNLS+Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03.monoABE8.1_bpNLS+Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04.monoABE8.1_bpNLS+Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05.monoABE8.1_bpNLS+V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06.monoABE8.1_bpNLS+T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07.monoABE8.1_bpNLS+Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08.monoABE8.1_bpNLS+Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09.monoABE8.1_bpNLS+Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10.monoABE8.1_bpNLS+Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11.monoABE8.1_bpNLS+Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12.monoABE8.1_bpNLS+Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13.monoABE8.1_bpNLS+H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14.monoABE8.1_bpNLS+V82S+Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
一部の実施形態では、塩基エディターは、第9世代ABE(ABE9)である。一部の実施形態では、ABE9は、TadA*9バリアントを含む。ABE9塩基エディターは、アデノシンデアミナーゼのバリアントを含み、本明細書に記載されるように、ABE7*10参照配列に対する改変を含むアミノ酸配列を含む。表19で使用される「単量体」という用語は、TadA*7.10の単量体形態を指し、表19に記載の改変を含む。表19で使用される「ヘテロ二量体」という用語は、TadA*7.10に融合された特定の野生型E.coli TadAアデノシンデアミナーゼを指し、本明細書に記載されるように、表19に記載の改変を含む。ABE9塩基エディターの詳細は、国際PCT出願第PCT/2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。
一部の実施形態では、塩基エディターは、核酸塩基エディタードメイン(例えば、デアミナーゼドメインの全部または一部)に融合されたポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9由来ドメイン)を含む融合タンパク質である。特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質のいずれかは、減少したヌクレアーゼ活性を有するCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、または二本鎖DNA分子の1つの鎖を切断するCas9ドメイン(Cas9ニッカーゼ(nCas9)と称される)を有し得る。
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害因子(UGI)の全部または一部を含むドメインをさらに含む。一部の実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などのウラシル結合タンパク質(UBP)の全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼ(NAP)の全部または一部をドメインとして含み得る。例えば、塩基エディターは、真核生物のNAPの全部または一部を含み得る。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼι、ポリメラーゼκ、またはポリメラーゼηである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼα、β、γ、δ、ε、γ、η、ι、κ、λ、μ、またはν成分である。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)と、少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%同一であるアミノ酸配列を含む。一部の実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
一部の実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメインのうちの1つ以上を含み得る。一部の実施形態では、塩基エディターの1つ以上のドメインは、ドメインを含むポリペプチドの野生型バージョンに対して変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラマブルDNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラマブルDNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。
本明細書に開示される塩基エディターの異なるドメイン(例えば、隣接ドメイン)は、1つ以上のリンカードメイン(例えば、XTENリンカードメイン)の使用の有無にかかわらず、互いに接続され得る。一部の実施形態では、リンカードメインは、結合(例えば、共有結合)、化学基、または2つの分子もしくは部分(例えば、融合タンパク質の2つのドメイン、例えば、第1のドメイン(例えば、Cas9由来ドメイン)および第2のドメイン(例えば、アデノシンデアミナーゼドメインもしくはシチジンデアミナーゼドメイン))を連結する分子であり得る。一部の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。一部の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、β-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられるが、これらに限定されない。一部の実施形態では、リンカーは、RNAプログラマブルヌクレアーゼ(Cas9ヌクレアーゼドメインを含む)のgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。一部の実施形態では、リンカーは、dCas9と、第2のドメイン(例えば、UGIなど)とを連結する。
リンカー
特定の実施形態では、リンカーを使用して、本発明のペプチドまたはペプチドドメインのいずれかを結合し得る。リンカーは、共有結合のように単純であってもよく、または数原子の長さの高分子リンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸に基づく。他の実施形態では、リンカーは、ペプチド様ではない。特定の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、β-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーは、アミノ酸を含む。特定の実施形態では、リンカーは、ペプチドを含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられるが、これらに限定されない。
典型的には、リンカーは、2つの基、分子、もしくは他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介して各々に連結され、したがって、両者を連結する。一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、2~100アミノ酸長、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸長である。一部の実施形態では、リンカーは、約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸長である。また、より長いまたはより短いリンカーも企図される。
一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、リンカーを介して互いに融合されるシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとを含む。シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターの活性に最適な長さを達成するために、シチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとの間のリンカーには、様々な鎖長および柔軟性を用いることができる(例えば、(GGGS)、(GGGGS)、および(G)の非常に柔軟なリンカーの形態から、(EAAAK)、(SGGS)、SGSETPGTSESATPES(例えば、Guilinger JP,et al.Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32(6):577-82を参照されたい。その内容全体が、参照により本明細書に援用される)、および(XP)のより剛性なリンカーの形態までの範囲で)。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、(GGS)モチーフを含み、nは、1、3、または7である。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかのシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとは、アミノ酸配列SGSETPGTSESATPESを含むリンカー(XTENリンカーとも称され得る)を介して融合される。一部の実施形態では、リンカーは、複数のプロリン残基を含み、5~21、5~14、5~9、5~7アミノ酸長、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)、P(AP)、P(AP)10である(例えば、Tan J,Zhang F,Karcher D,Bock R.Engineering of high-precision base editors for site-specific single nucleotide replacement.Nat Commun.2019 Jan 25;10(1):439を参照されたい。その内容全体が、参照により本明細書に援用される)。このようなプロリンに富むリンカーは、「剛性」リンカーとも称される。
別の実施形態では、塩基エディターシステムは、デアミナーゼ(DNAデアミナーゼ、例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)と非共有結合的に相互作用し、かつ、特定の編集のために、アデノシンデアミナーゼまたはシチジンデアミナーゼを標的ポリヌクレオチド配列内の標的核酸塩基に一過的に引き付ける成分(タンパク質)を含み、バイスタンダー効果または標的隣接効果が最小化または低減される。デアミナーゼ相互作用タンパク質を伴うかかる非共有結合のシステムおよび方法は、DNAデアミナーゼを特定のゲノム標的核酸塩基に引き付ける役割を果たし、オンターゲットおよび標的隣接編集の事象を切り離し、したがって、より正確な単一塩基置換変異の達成を強化する。一実施形態では、デアミナーゼ相互作用タンパク質は、デアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)に結合し、デアミナーゼの活性(触媒)部位が標的核酸塩基(例えば、それぞれ、アデノシンまたはシチジン)に結合するのを遮断または妨害しない。例えば、「MagnEdit」と称されるシステムは、Cas9およびgRNAの複合体に繋がれた相互作用タンパク質を伴い、特定のゲノム標的部位を編集するために共発現されたアデノシンデアミナーゼまたはシチジンデアミナーゼ(外因性または内因性のいずれか)を引き付けることができ、McCann,J.et al.,2020,“MagnEdit-interacting factors that recruit DNA-editing enzymes to single base targets,”Life-Science-Alliance,Vol.3,No.4(e201900606),(doi 10.26508/Isa.201900606)に記載されている(その内容は、その全体が参照により本明細書に援用される)。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。
別の実施形態では、「Suntag」と呼ばれるシステムは、隣接する標的編集を削減した状態で、ポリヌクレオチド標的部位での塩基編集を達成するために、ポリヌクレオチド標的部位に対する塩基編集の、タンパク質(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)成分を動員するために使用される非共有結合相互作用成分またはその複数のコピーを伴い、これは、例えば、Tanenbaum,M.E.et al.,“A protein tagging system for signal amplification in gene expression and fluorescence imaging,”Cell.2014 October 23;159(3):635-646.doi:10.1016/j.cell.2014.09.039、およびHuang,Y.-H.et al.,2017,“DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A,”Genome Biol 18:176.doi:10.1186/s13059-017-1306-zに記載されている(これらの各々の内容は、その全体が参照により本明細書に援用される)に記載されている。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。
ガイドRNAを有する核酸プログラマブルDNA結合タンパク質
宿主細胞、例えば、免疫細胞(例えば、T細胞またはNK細胞)における塩基編集のための組成物および方法が本明細書に提供される。ガイドポリ核酸配列(例えば、ガイドRNA配列)または本明細書に提供される2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上のガイドRNAの組み合わせを含む組成物が本明細書にさらに提供される。一部の実施形態では、本明細書に提供されるよ塩基編集のための組成物は、塩基エディター(例えば、C塩基エディターまたはA塩基エディター)をコードするポリヌクレオチドをさらに含む。例えば、塩基編集のための組成物は、BE、BE4、ABE、および提供される1つ以上のガイドRNAの組み合わせをコードするmRNA配列を含み得る。塩基編集のための組成物は、塩基エディターポリペプチドと、本明細書に提供される任意のガイドRNAのうちの1つ以上の組み合わせとを含み得る。かかる組成物を使用して、異なる送達アプローチ(例えば、エレクトロポレーション、ヌクレオフェクション、ウイルス形質導入、またはトランスフェクション)を介して、免疫細胞で塩基編集を実現してもよい。一部の実施形態では、組成物は、エレクトロポレーションのために、塩基エディターをコードするmRNA配列と、本明細書に提供される1つ以上のガイドRNA配列の組み合わせとを含む。
本開示の一部の態様は、複合体を提供し、本明細書に提供される融合タンパク質のうちのいずれかと、融合タンパク質の核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン(例えば、Cas9(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)またはCas12)に結合したガイドRNAと、を含む。これらの複合体は、リボ核タンパク質(RNP)とも呼ばれる。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的な、少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。一部の実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列は、DNA配列である。一部の実施形態では、標的配列は、RNA配列である。一部の実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノムの配列である。一部の実施形態では、標的配列は、ヒトのゲノムの配列である。一部の実施形態では、標的配列の3’末端は、正準PAM配列(NGG)に直接隣接する。一部の実施形態では、標的配列の3’末端は、非正準PAM配列(例えば、表5に列挙される配列または5’-NAA-3’)に直接隣接する。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、疾患または障害に関連する遺伝子)の配列に相補的である。
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書に提供される融合タンパク質のいずれかと、少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、例えば、TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位に直接隣接する。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けのスキームに依存することが理解されるであろう。番号付けは、例えば、成熟タンパク質の前駆体および成熟タンパク質自体において異なる場合があり、種ごとの配列の違いは番号付けに影響を及ぼす場合がある。当業者であれば、当該技術分野で周知の方法(例えば、配列整列および相同残基の決定)によって、任意の相同タンパク質およびそれぞれのコード核酸におけるそれぞれの残基を特定することができるであろう。
本明細書に開示される融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的指向化するために、典型的には、融合タンパク質をガイドRNAとともに共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、napDNAbp(例えば、Cas9またはCas12)結合を可能にするtracrRNAフレームワークと、napDNAbp:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替的に、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。特定のゲノム標的部位にnapDNAbp:核酸編集酵素/ドメイン融合タンパク質を標的指向化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。かかる好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的指向化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。
sgRNAの異なる部分は、Cas9(例えば、SpyCas9)および/またはDNA標的と相互作用する様々な特徴を形成することが予測される。6つの保存されたモジュールが、天然のcrRNA:tracrRNA二重鎖およびCas9エンドヌクレアーゼ活性を指示するシングルガイドRNA(sgRNA)内で特定されている(Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339を参照されたい)。6つのモジュールには、DNA標的化に関与するスペーサー、CRISPRリピート:tracrRNA二重鎖によって形成される上部ステム、バルジ、下部ステム、ネクサス、およびtracrRNAの3’末端由来のヘアピンが含まれる。上部ステムおよび下部ステムは、主に、リン酸骨格との配列非依存性相互作用を通してCas9と相互作用する。一部の実施形態では、上部ステムは、不要である。一部の実施形態では、下部ステムの基部の保存されたウラシルヌクレオチド配列は、不要である。バルジは、Cas9のRec1ドメインとの特定の側鎖相互作用に関与する。U44の核酸塩基は、Tyr325およびHis328の側鎖と相互作用し、G43は、Tyr329と相互作用する。ネクサスは、sgRNA:Cas9相互作用のコアを形成し、sgRNAと、Cas9および標的DNAの両方との間の交点にある。A51およびA52の核酸塩基は、Phe1105の側鎖と相互作用し、U56は、Arg457およびAsn459と相互作用し、U59の核酸塩基は、Arg74、Asn77、Pro475、Leu455、Phe446、およびIle448の側鎖によって既定される疎水性ポケットに挿入し、C60は、Leu455、Ala456、およびAsn459と相互作用し、C61は、Arg70の側鎖と相互作用し、次に、C15と相互作用する。一部の実施形態では、これらの変異のうちの1つ以上は、sgRNA:Cas9相互作用を最適化するために、Cas9(例えば、spyCas9)に対するsgRNAのバルジおよび/またはネクサスにおいて作製される。
さらに、tracrRNAのネクサスおよびヘアピンは、Cas9の対形成にとって重要であり、異なるCas9タンパク質を分離する直交性障壁(orthogonality barrier)を交差するようにスワップ(swap)することができ、これは、直交Cas9(orthogonal Cas9)タンパク質のさらなる利用に役立つ。一部の実施形態では、ネクサスおよびヘアピンは、直交Cas9タンパク質を標的とするようにスワップされる。一部の実施形態では、sgRNAは、よりコンパクトで、立体構造的に安定なガイドRNAを設計するために、上部ステム、ヘアピン1、および/または下部ステムの配列柔軟性が省かれる。一部の実施形態では、モジュールは、様々なキメラガイドを有する単一のCas9を使用するか、またはキメラsgRNAの異なる組み合わせを有する直交系を同時に使用することによって、多重編集を最適化するように修飾される。ガイド機能モジュールおよびその方法に関する詳細は、例えば、Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339に記載されている(その内容は、その全体が参照により本明細書に援用される)。
本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9またはCas12)およびデアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)を含む融合タンパク質を含む塩基エディターの非限定的な例としては、以下のように配置することができる:
NH-[核酸塩基編集ドメイン]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-リンカー2-[UGI]-COOH、
NH-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH-[アデノシンデアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-COOH、
NH-[デアミナーゼ]-[イノシンBER阻害因子]-[核酸塩基編集ドメイン]-COOH、
NH-[イノシンBER阻害因子]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH-[核酸塩基編集ドメイン]-[デアミナーゼ]-[イノシンBER阻害因子]-COOH、
NH-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-[デアミナーゼ]-COOH、
NH-[イノシンBER阻害因子]-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[イノシンBER阻害因子]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害因子]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害因子]-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[イノシンBER阻害因子]NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH。
一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあることができる。一部の実施形態では、かかる定義された標的領域は、PAMの約15塩基上流にあり得る。Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、およびKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい(それらの内容全体が、参照により本明細書に援用される)。
定義された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、napDNAbpドメインに局在するC末端である。
融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えば、アデノシンデアミナーゼもしくはシチジンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子(UGI)ドメイン、エピトープタグ、レポーター遺伝子配列、ならびに/または以下の活性:メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子活性、遺伝子サイレンシング活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性のうちの1つ以上を有するタンパク質ドメインが挙げられる。追加のドメインは、異種機能ドメインであり得る。かかる異種機能ドメインは、例えば、ヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化などをもたらす、標的DNAと会合した標的ポリペプチド(例えば、ヒストン、DNA結合タンパク質など)の修飾などの機能活性を付与することができる。付与される他の機能および/または活性としては、トランスポザーゼ活性、インテグラーゼ活性、リコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、または上記の任意の組み合わせが挙げられる。
付与される他の機能としては、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性もしくはグリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、リモデリング活性、プロテアーゼ活性、オキシドレダクターゼ活性、トランスフェラーゼ活性、ヒドロラーゼ活性、リアーゼ活性、イソメラーゼ活性、シンターゼ活性、シンセターゼ活性、および脱ミリストイル化活性、またはそれらの任意の組み合わせが挙げられる。
ドメインは、エピトープタグ、レポータータンパク質、および他の結合ドメインで検出または標識され得る。エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、これらに限定されないが、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含む自家蛍光タンパク質が挙げられる。追加のタンパク質配列としては、DNA分子に結合するアミノ酸配列、または他の細胞分子に結合するアミノ酸配列を挙げることができ、これらに限定されないが、マルトース結合タンパク質(MBP)、Sタグ、LexA DNA結合ドメイン(DBD)融合物、GAL4 DNA結合ドメイン融合物、および単純ヘルペスウイルス(HSV)BP16タンパク質融合物が含まれる。
シチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとを含む融合タンパク質を使用する方法
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書に提供される融合タンパク質のいずれかと、少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列の3’末端は、正準PAM配列(NGG)に直接隣接する。一部の実施形態では、標的配列の3’末端は、正準PAM配列(NGG)に直接隣接していない。一部の実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接する。
一部の実施形態では、本発明の融合タンパク質は、目的の標的を変異誘発するために使用される。特に、本明細書に記載のシチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターは、標的配列内で複数の変異を作製することができる。これらの変異は、標的の機能に影響を及ぼし得る。例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼの核酸塩基エディターを使用して調節領域を標的化すると、調節領域の機能が変化し、下流タンパク質の発現が低減または排除される。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けのスキームに依存することが理解されるであろう。番号付けは、例えば、成熟タンパク質の前駆体および成熟タンパク質自体において異なる場合があり、種ごとの配列の違いは番号付けに影響を及ぼす場合がある。当業者であれば、当該技術分野で周知の方法(例えば、配列整列および相同残基の決定)によって、任意の相同タンパク質およびそれぞれのコード核酸におけるそれぞれの残基を特定することができるであろう。
本明細書に開示されるCas9ドメインとシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的指向化するために、典型的には、融合タンパク質をガイドRNA(例えば、sgRNA)と共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替的に、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的指向化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。かかる好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的指向化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。
塩基エディターの効率
一部の実施形態では、本発明に提供される方法の目的は、遺伝子編集を介して遺伝子産物の正常な機能を破壊することである。本明細書に提供される核酸塩基編集タンパク質は、インビトロでの遺伝子編集に基づくヒト治療薬について検証され得る。本明細書に提供される核酸塩基編集タンパク質(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを含む融合タンパク質)を使用して、AからGまたはCからTのヌクレオチドを編集できることが、当業者には理解されるであろう。
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。ほとんどのゲノム編集用途において、Cas9は、ガイドポリヌクレオチド(例えば、シングルガイドRNA(sgRNA))と複合体を形成し、sgRNA配列によって指定される標的部位で二本鎖DNA切断(DSB)を誘導する。細胞は、主に、非相同末端結合(NHEJ)修復経路を介してこのDSBに応答し、これが、確率的な挿入または欠失(インデル)をもたらし、フレームシフト変異を引き起こして、遺伝子を破壊し得る。DSBに隣接する配列に対する高度の相同性を有するドナーDNA鋳型の存在下で、遺伝子修正は、相同組換え修復(HDR)として知られる代替経路を介して達成され得る。残念ながら、ほとんどの非摂動条件下では、HDRは、非効率であり、細胞状態および細胞型に依存し、より大きなインデル頻度によって支配される。ヒト疾患に関連する既知の遺伝的バリエーションのほとんどが点変異であるため、より効率的できれいに正確な点変異を作製し得る方法が必要である。本明細書に提供される塩基エディターシステムは、二本鎖DNA切断を生成せず、ドナーDNA鋳型を必要とせず、かつ過剰な確率的な挿入および欠失を誘発しない、ゲノム編集を提供する新しい方法を提供する。
一部の実施形態では、本開示は、塩基エディターを提供し、相当数の意図されていない変異(例えば、意図されていない点変異)を生成することなく、核酸(例えば、対象のゲノム内の核酸)の終止コドンなどの「意図された変異」を効率的に生成する。一部の実施形態では、意図された変異は、意図された変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)によって生成される変異である。一部の実施形態では、意図された変異は、疾患または障害、例えば、T細胞またはNK細胞悪性腫瘍に関連する標的抗原に関連する遺伝子に存在する。一部の実施形態では、意図された変異は、疾患または障害、例えば、T細胞またはNK細胞悪性腫瘍に関連する標的抗原に関連する遺伝子におけるアデニン(A)からグアニン(G)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、意図された変異は、疾患または障害、例えば、T細胞またはNK細胞悪性腫瘍に関連する標的抗原に関連する遺伝子におけるチミン(T)からシトシン(C)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のチミン(T)からシトシン(C)への点変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する点変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。
本発明の塩基エディターは、有意な割合のインデルを生成することなく、タンパク質をコードする特定のヌクレオチド塩基を有利に修飾する。本明細書で使用される場合、「インデル」は、核酸内のヌクレオチド塩基の挿入または欠失を指す。かかる挿入または欠失は、遺伝子のコード領域内のフレームシフト変異をもたらし得る。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異)する塩基エディターを生成することが望ましい。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異またはメチル化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、メチル化)を生成することができる。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、変異)を生成することができる。
一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超えるインデルに対する意図された変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上であるインデルに対する意図された変異の比率を生成することができる。意図された変異およびインデルの数は、任意の好適な方法を使用して決定され得る。
一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、核酸の領域におけるインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に制限し得る。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。
本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、相当数の意図しない変異(例えば、偽オフターゲット編集またはバイスタンダー編集)を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異を効率的に生成することができるという認識に基づく。一部の実施形態では、意図された変異は、意図された変異を生成するように特別に設計された、gRNAに結合した特定の塩基エディターによって生成される変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。一部の実施形態では、意図された変異は、遺伝子のスプライシングを変化させる変異である。一部の実施形態では、意図された変異は、遺伝子の調節配列(例えば、遺伝子のプロモーターまたは遺伝子のリプレッサー)を変化させる変異である。一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超える意図された変異:意図されていない変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれ以上である、意図された変異:意図されていない変異の比率を生成することができる。本明細書に記載の塩基エディターの特徴が、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。
塩基編集は、遺伝的修飾、遺伝子修飾、および核酸配列の修飾などの「修飾(modification)」と呼ばれることが多く、修飾が塩基編集修飾である文脈に基づいて、明確に理解され得る。したがって、塩基編集修飾は、例えば、本開示全体通して論じられるデアミナーゼ活性の結果として、ヌクレオチド塩基レベルでの修飾であり、これは次いで、遺伝子配列の変化をもたらし、遺伝子産物に影響を及ぼし得る。したがって、本質的には、本明細書に記載の遺伝子編集修飾は、構造的および/または機能的に、遺伝子の修飾をもたらすことができ、遺伝子産物の発現が修飾され得るか(例えば、遺伝子の発現がノックアウトされ得るか)、もしくは逆に強化され得るか、または、状況によっては、遺伝子の機能もしくは活性が修飾され得る。本明細書に開示される方法を使用する場合、塩基編集効率は、塩基編集が行われる遺伝子のノックダウン効率として決定され得、塩基編集が、遺伝子の発現をノックダウンするように意図される。ノックダウンレベルは、タンパク質発現レベルのアッセイなどの任意の検出アッセイ(例えば、フローサイトメトリー)、定量的RT-PCR、ノーザンブロット分析などのRNA発現の検出アッセイ、またはパイロ配列決定などの任意の他の好適なアッセイによって発現レベルを決定することによって定量的に検証することができ、ヌクレオチド配列決定反応によって定性的に検証することができる。
一部の実施形態では、修飾(例えば、単一塩基編集)は、遺伝子標的化発現の少なくとも10%の低減をもたらす。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも10%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも20%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも30%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも40%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも50%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも60%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも70%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも80%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも90%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも91%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも92%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも93%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも94%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも95%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも96%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも97%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも98%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも99%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化される遺伝子のノックアウト(遺伝子発現の100%ノックダウン)をもたらし得る。
一部の実施形態では、本明細書に提供される塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
一部の実施形態では、標的化修飾(例えば、単一塩基編集)は、異なるガイドRNAを用いた塩基編集に対して、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17,18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個の異なる内因性配列を標的化するために同時に使用される。一部の実施形態では、標的化修飾(例えば、単一塩基編集)は、異なるガイドRNAを用いた塩基編集に対して、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の異なる内因性遺伝子配列を順次標的化するために使用される。
本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、意図しない点変異(すなわち、バイスタンダーの変異)などの相当数の意図しない変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異(例えば、点変異)を効率的に生成することができるという認識に基づく。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも0.01%の意図された変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、意図された変異の少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%を生成することができる。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、0.8%未満のインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、最大0.8%のインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、0.3%未満のインデル形成をもたらす。一部の実施形態では、記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列において、より低いインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8編集バリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列において、より低いインデル形成をもたらす。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、減少したインデル頻度を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%減少したインデル頻度を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%のインデル頻度の減少を有する。
本発明は、効率および特異性の増加を有するアデノシンデアミナーゼのバリアント(例えば、ABE8バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼのバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることを意図しない塩基(例えば、「バイスタンダー」)を編集する可能性がより低い。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、減少したバイスタンダーの編集または変異を有する。一部の実施形態では、意図しない編集または変異は、標的ヌクレオチド配列の標的ウィンドウにおける意図しない位置または非標的位置における標的塩基(例えば、AまたはC)のバイスタンダー変異またはバイスタンダー編集である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、バイスタンダー編集または変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムを含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少している。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少したバイスタンダー編集または変異を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれかは、減少した偽編集を有する。一部の実施形態では、意図しない編集または意図しない変異は、偽変異または偽編集(例えば、ゲノムの意図しない領域または非標的領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存性編集)である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、偽編集または偽変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少した偽編集を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少した偽編集または偽変異を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。一部の実施形態では、塩基編集効率は、細胞集団における編集された核酸塩基の割合を計算することによって測定され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された標的核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高いオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。
本明細書に記載のABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAとして宿主細胞に送達される。一部の実施形態では、核酸ベースの送達システム(例えば、mRNA)を介して送達されるABE8塩基エディターは、編集された核酸塩基によって測定した場合、少なくとも少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。一部の実施形態では、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたす。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、より低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも約2.2倍減少したガイドオフターゲット編集効率を有する。
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、ガイド非依存性オフターゲット編集効率が低い。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、134.0倍低いガイド非依存性オフターゲット編集効率(例えば、偽RNA脱アミノ化)有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、ゲノムにわたってガイド非依存性変異率を増加させない。
一部の実施形態では、単一の遺伝子送達事象を使用して(例えば、形質導入、トランスフェクション、エレクトロポレーション、または任意の他の方法により)、細胞のゲノム内の5つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の6つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の7つの配列の塩基編集を標的化することができる。一部の実施形態では、単一のエレクトロポレーション事象を使用して、細胞のゲノム内の8つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の9つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の10個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の20個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の30個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の40個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の50個の配列の塩基編集を標的化することができる。
一部の実施形態では、本明細書に記載の方法(例えば、塩基編集方法)は、最小限~皆無のオフターゲット効果を有する。
一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも50%の正常に編集された細胞集団(すなわち、正常に操作された細胞)をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも55%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも60%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも65%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも70%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも75%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも80%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも85%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも90%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも95%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、約91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の正常に編集された細胞集団をもたらす。
一部の実施形態では、塩基編集介入後の生細胞の回収率は、塩基編集事象の時点で、開始細胞集団のうちの少なくとも60%、70%、80%、90%を超える。一部の実施形態では、上に記載される生細胞の回収率は、約70%である。一部の実施形態では、上に記載される生細胞の回収率は、約75%である。一部の実施形態では、上に記載される生細胞の回収率は、約80%である。一部の実施形態では、上に記載される生細胞の回収率は、約85%である。一部の実施形態では、上に記載される生細胞の回収率は、塩基編集事象の時点で、細胞集団のうちの約90%、または約91%、92%、93%、94%、95%、96%、97%、98%、または99%、または100%である。
一部の実施形態では、操作された細胞集団は、インビトロでさらに約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、約15倍、約20倍、約25倍、約30倍、約35倍、約40倍、約45倍、約50倍、または約100倍に増殖され得る。
意図された変異およびインデルの数は、例えば、国際PCT出願第PCT/2017/045381号(WO2018/027078)および第PCT/US2016/058344号(WO2017/070632)、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、ならびにKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)に記載されている任意の好適な方法を使用して決定することができる(それらの内容全体が、参照により本明細書に援用される)。
一部の実施形態では、インデル頻度を計算するために、配列決定リード(sequencing reads)は、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列と正確に一致するようにスキャンされる。正確な一致が見つからない場合、リードは、分析から除外される。このインデルウィンドウの長さが参照配列と完全に一致する場合、リードは、インデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いまたは短い場合、配列決定リードは、それぞれ、挿入または欠失として分類される。一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。
塩基エディター効率の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)および第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)、およびKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)も参照されたい(それらの内容全体が、参照により本明細書に援用される)。一部の実施形態では、本明細書に提供される方法を使用して、1つ以上の遺伝子における複数の核酸塩基対を編集することで、少なくとも1つの意図された変異の形成がもたらされる。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子の正常な機能の破壊をもたらす。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子によってコードされるタンパク質の発現を低減または排除する。多重編集が、本明細書に提供される任意の方法または方法の組み合わせを使用して達成され得ることを理解されたい。
多重編集
一部の実施形態では、本発明に提供される塩基エディターシステムは、1つ以上の遺伝子において、複数の核酸塩基対を多重編集することができる。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。一部の実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、シングルガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される任意の塩基エディターを使用する方法の任意の組み合わせに適用され得ることを理解されたい。本明細書に記載される塩基エディターのいずれを使用した多重編集は、複数の核酸塩基対の順次編集を含むこともできることを理解されたい。
一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子内にある。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子内にある。一部の実施形態では、1つ以上の遺伝子内の少なくとも1つの遺伝子が、異なる遺伝子座に位置する。
一部の実施形態では、編集は、少なくとも1つのタンパク質コード領域における、複数の核酸塩基対の編集である。一部の実施形態では、編集は、少なくとも1つのタンパク質非コード領域における、複数の核酸塩基対の編集である。一部の実施形態では、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における、複数の核酸塩基対の編集である。
一部の実施形態では、編集は、1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、塩基エディターシステムは、シングルガイドポリヌクレオチドと併せて1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチドと併せて1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと併される。一部の実施形態では、編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドと併される。一部の実施形態では、編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物と併される。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の組み合わせのいずれかに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次編集を含むことができることも理解されたい。
一部の実施形態では、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、ABE9塩基エディターのうちの1つを含む。一部の実施形態では、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む。一部の実施形態では、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、より高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍高い多重編集効率を有する。
送達システム
遺伝子(例えばCD2)における1つ以上のヌクレオチドを標的化するための核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態では、目的の単一細胞は、レポーター(例えば、GFP)をコードする少量のベクターと一緒に、本明細書に記載の塩基エディターシステムをコードする核酸分子(複数可)でトランスフェクトされるか、形質導入されるか、またはその他修飾される。これらの細胞は、免疫細胞(例えば、T細胞またはNK細胞)を含む当該技術分野で既知の任意の細胞株、または不死化ヒト細胞株(例えば、293T、K562、またはU20S)であり得る。あるいは、初代細胞(例えば、ヒト)を使用してもよい。細胞は、対象または個体から(例えば、組織生検、手術、血液、血漿、血清、または他の生体液からも得ることができる。かかる細胞は、最終的な細胞標的に関連し得る。
送達は、ウイルスベクターを使用して行ってもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(例えば、LipofectamineまたはFugene)を使用して、またはエレクトロポレーションによって行ってもよい。トランスフェクション後、レポーター(例えば、GFP)の発現は、蛍光顕微鏡法またはフローサイトメトリーのいずれかによって決定して、一貫した高レベルのトランスフェクションを確認することができる。これらの予備トランスフェクションは、どのエディターの組み合わせが最大の活性を与えるかを決定するために、異なる核酸塩基エディターを含むことができる。システムは、1つ以上の異なるベクターを含むことができる。一実施形態では、塩基エディターは、所望の細胞型、好ましくは真核細胞、好ましくは哺乳動物細胞またはヒト細胞の発現のために、コドン最適化される。
核酸塩基エディターの活性は、本明細書に記載のように、すなわち、細胞のゲノムを配列決定して標的配列における改変を検出することによって、評価される。サンガー配列決定の場合、精製されたPCRアンプリコンをプラスミド骨格にクローニングし、形質転換し、ミニプレッドし、単一のプライマーを用いて配列決定する。配列決定は、次世代配列決定(NGS)技術を使用してもよい。次世代配列決定を使用する場合、アンプリコンは、300~500bpであり得、非対称に配置された意図されたカット部位を有する。PCR後、次世代配列決定のアダプターおよびバーコード(例えば、Illumina多重アダプターおよびマルチプレックスインデックス)を、例えば、ハイスループット配列決定(例えば、Illumina MiSeq)で使用するために、アンプリコンの末端に添加してもよい。初期試験において最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価のために選択することができる。
特定の実施形態では、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態では、本発明の核酸塩基エディターは、細胞のゲノム内の1つ以上の目的の核酸配列を標的化するために使用される1つ以上のガイドRNAと併せて細胞(例えば、免疫細胞(例えば、T細胞またはNK細胞))に送達され、それによって、標的遺伝子(例えば、CD2)が改変される。一部の実施形態では、塩基エディターは、1つ以上のガイドRNAによって標的指向化され、1つ以上の目的の遺伝子(例えば、CD2、TRAC、B2M、CIITA、TRBC1、TRBC2、PD-1、CD52)の配列に、1つ以上の編集を導入する。一部の実施形態では、1つ以上の目的の遺伝子の配列に対する1つ以上の編集は、宿主細胞(例えば、免疫細胞(例えば、T細胞またはNK細胞))における遺伝子によってコードされるタンパク質の発現を、低減または排除する。一部の実施形態では、1つ以上の目的の遺伝子(例えば、CD2)によってコードされる1つ以上のタンパク質の発現は、宿主細胞(例えば、免疫細胞(例えば、T細胞またはNK細胞))において、完全にノックアウトまたは排除される。
一部の実施形態では、宿主細胞は、哺乳動物細胞である。一部の実施形態では、宿主細胞は、ヒト細胞である。一部の実施形態では、宿主細胞は、免疫細胞である。一部の実施形態では、免疫細胞は、T細胞である。一部の実施形態では、免疫細胞は、NK細胞である。一部の実施形態では、1つ以上の編集は、CD2、CD3、CD5、CD7、CD52、B2M、CIITA、TRBC1、TRBC2、TRAC、およびPD-1、またはそれらの組み合わせから選択される1つ以上の遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD2遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD5遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD7遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD2、CD52、TRAC、およびPD-1遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD5、CD52、TRAC、およびPD-1遺伝子に導入される。一部の実施形態では、1つ以上の編集は、CD7、CD3、CD52、およびPD-1遺伝子に導入される。
核酸ベースの核酸編集およびgRNAの送達
本開示によるシチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターをコードする核酸は、当該技術分野で既知の方法により、もしくは本明細書に記載のように、対象に投与されるか、またはインビトロもしくはインビボで細胞に送達され得る。例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターは、例えば、ベクター(例えば、ウイルスベクターまたは非ウイルスベクター)、非ベクターベースの方法(例えば、裸のDNA、DNA複合体、脂質ナノ粒子を使用する)、またはそれらの組み合わせによって送達され得る。
シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターをコードする核酸は、例えば、トランスフェクションもしくはエレクトロポレーションの方法によって、裸のDNAまたはRNAとして細胞(例えば、免疫細胞)に直接送達され得るか、または標的細胞による取り込みを促進する分子(例えば、N-アセチルガラクトサミン)にコンジュゲートされ得る。本明細書に記載のベクターなどの核酸ベクターも使用することができる。特定の実施形態では、ポリヌクレオチド(例えば、塩基エディターまたはその機能成分をコードするmRNA)は、本明細書に記載のように、複数のガイドRNAの組み合わせと共エレクトロポレーションされ得る。
核酸ベクターは、本明細書に記載の融合タンパク質のドメインをコードする1つ以上の配列を含むことができる。ベクターはまた、タンパク質をコードする配列に関連する(例えば、タンパク質をコードする配列に挿入または融合された)シグナルペプチドをコードする配列も含むことができる(例えば、核局在化、核小体局在化、またはミトコンドリア局在化のための)。一例として、核酸ベクターは、1つ以上の核局在化配列(例えば、SV40由来の核局在化配列)、および1つ以上のデアミナーゼを含むCas9コード配列を含むことができる。
核酸ベクターはまた、任意の好適な数の調節/制御エレメント(例えば、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位(IRES))を含むことができる。これらのエレメントは、当該技術分野で周知である。
本開示による核酸ベクターとしては、組換えウイルスベクターが挙げられる。例示的なウイルスベクターは、上記の本明細書に記載されている。当該技術分野で既知の他のウイルスベクターも使用することができる。加えて、ウイルス粒子を使用して、核酸および/またはペプチドの形態で、ゲノム編集システムの成分を送達することができる。例えば、「空の」ウイルス粒子は、任意の好適なカーゴ(cargo)を含むように組み立てることができる。ウイルスベクターおよびウイルス粒子は、標的組織特異性を改変するために、標的化リガンドを組み込むように操作することもできる。
ウイルスベクターに加えて、非ウイルスベクターを使用して、本開示に従って、ゲノム編集システムをコードする核酸を送達することができる。非ウイルス核酸ベクターの1つの重要なカテゴリーは、ナノ粒子であり、有機または無機であり得る。ナノ粒子は、当該技術分野で周知である。任意の好適なナノ粒子設計を使用して、ゲノム編集システムの成分、またはかかる成分をコードする核酸を送達することができる。例えば、有機(例えば脂質および/またはポリマー)ナノ粒子は、本開示の特定の実施形態では、送達ビヒクルとして使用するのに好適であり得る。表18(以下)に、ナノ粒子製剤、および/または遺伝子導入に使用するための例示的な脂質を示す。
表19は、遺伝子導入および/またはナノ粒子製剤に使用される例示的なポリマーを列挙する。
表20は、本明細書に記載の融合タンパク質をコードするポリヌクレオチドの送達方法を要約する。
別の態様では、ゲノム編集システムの成分またはかかる成分をコードする核酸(例えば、Cas9またはそのバリアントなどの核酸結合タンパク質)、ならびに目的のゲノム核酸配列を標的とするgRNAの送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、標的gRNAとの複合体中に、核酸結合タンパク質(例えば、Cas9)を含む。RNPは、例えば、Zuris,J.A.et al.,2015,Nat.Biotechnology,33(1):73-80によって報告されているように、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質媒介性の方法などの既知の方法を使用して細胞に送達され得る。RNPは、CRISPR塩基エディターシステムでの使用に有利であり、特に、トランスフェクトが困難な細胞(例えば、初代細胞)に有利である。加えて、RNPはまた、特に、CRISPRプラスミドにおいて使用され得る真核生物プロモーター(例えば、CMVまたはEF1A)が十分に発現していない場合、細胞内のタンパク質発現で生じ得る困難を緩和することができる。有利には、RNPの使用は、細胞内への外来DNAの送達を必要としない。さらに、核酸結合タンパク質とgRNA複合体とを含むRNPは、時間とともに分解されるため、RNPの使用は、オフターゲット効果を制限する可能性がある。プラスミドベースの技術の場合と同様の様式で、RNPを使用して、結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を誘導することができる。
塩基エディターをコードする核酸分子の発現を駆動するために使用されるプロモーターは、AAV ITRを含むことができる。これは、ベクター内の空間を占有し得る追加のプロモーターエレメントの必要性を排除するために有利であり得る。解放された追加の空間を使用して、追加のエレメント(例えば、ガイド核酸または選択可能なマーカー)の発現を駆動することができる。ITR活性は比較的弱いため、選択されたヌクレアーゼの過剰発現による潜在的な毒性を低減するために使用することができる。
任意の好適なプロモーターを使用して、塩基エディターおよび(該当する場合)ガイド核酸の発現を駆動することができる。遍在的な発現の場合、使用され得るプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳または他のCNS細胞での発現の場合、好適なプロモーターとしては、すべてのニューロンに対してシナプシンI、興奮性ニューロンに対してCaMKIIα、GABA作動性ニューロンに対してGAD67もしくはGAD65またはVGATなどが挙げられ得る。肝細胞での発現の場合、好適なプロモーターとしては、アルブミンプロモーターが挙げられる。肺細胞での発現の場合、好適なプロモーターとしては、SP-Bが挙げられ得る。内皮細胞の場合、好適なプロモーターとしては、ICAMが挙げられ得る。造血細胞の場合、好適なプロモーターとしては、IFNβまたはCD45が挙げられ得る。骨芽細胞の場合、好適なプロモーターとしては、OG-2が挙げられ得る。
一部の実施形態では、本開示の塩基エディターは、別個のプロモーターが、同じ核酸分子内の塩基エディターおよび適合するガイド核酸の発現を駆動させるのにサイズが十分な小さいものである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に連結された第2のプロモーターとを含むことができる。
ガイド核酸の発現を駆動するために使用されるプロモーターとしては、U6またはH1などのPolIIIプロモーターが挙げられ得る。gRNAアデノ随伴ウイルス(AAV)を発現するには、Pol IIプロモーターおよびイントロンカセットを使用する。
特定の実施形態では、本発明の融合タンパク質は、ウイルスベクター(例えば、アデノ随伴ウイルス(AAV)、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10、およびそれらのバリアント)中に存在するポリヌクレオチド、または任意のウイルスベクターの好適なカプシドタンパク質によってコードされる。したがって、一部の態様では、本開示は、融合タンパク質のウイルス送達に関する。ウイルスベクターの例としては、レトロウイルスベクター(例えば、マロニー(Maloney)マウス白血病ウイルス、MML-V)、アデノウイルスベクター(例えば、AD100)、レンチウイルスベクター(HIVおよびFIVベースのベクター)、ヘルペスウイルスベクター(例えば、HSV-2)が挙げられる。
一部の態様では、免疫細胞における特定の遺伝子を編集するための本明細書に記載の方法を使用して、CAR-T細胞を遺伝子修飾することができる。かかるCAR-T細胞、およびかかるCAR-T細胞を産生するための方法は、国際出願第PCT/US2016/060736号、第PCT/US2016/060734号、第PCT/US2016/034873号、第PCT/US2015/040660号、第PCT/EP2016/055332号、第PCT/IB2015/058650号、第PCT/EP2015/067441号、第PCT/EP2014/078876号、第PCT/EP2014/059662号、第PCT/IB2014/061409号、第PCT/US2016/019192号、第PCT/US2015/059106号、第PCT/US2016/052260号、第PCT/US2015/020606号、第PCT/US2015/055764号、第PCT/CN2014/094393号、第PCT/US2017/059989号、第PCT/US2017/027606号、および第PCT/US2015/064269号に記載されている(各々の内容は、その全体が本明細書に援用される)。
ウイルスベクター
したがって、本明細書に記載の塩基エディターは、ウイルスベクターとともに送達され得る。一部の実施形態では、本明細書に開示される塩基エディターは、ウイルスベクターに含まれる核酸上にコードされ得る。一部の実施形態では、塩基エディターシステムの1つ以上の成分は、1つ以上のウイルスベクター上にコードされ得る。例えば、塩基エディターおよびガイド核酸は、単一のウイルスベクター上にコードされ得る。他の実施形態では、塩基エディターおよびガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合も、塩基エディターおよびガイド核酸は、各々、プロモーターおよびターミネーターに作動可能に連結され得る。ウイルスベクター上にコードされる成分の組み合わせは、選択されたウイルスベクターのカーゴサイズ制約によって決定され得る。
塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養物中または宿主内の特定の細胞にウイルスを標的指向化し、ウイルスペイロードを核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、培養物中の細胞、患者に(インビボで)直接投与することができ、または、インビトロで細胞を処理するためにそれらを使用することができ、修飾細胞は、任意選択的に(エクスビボで)患者に投与され得る。従来のウイルスベースのシステムは、遺伝子導入用のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、および単純ヘルペスウイルスのベクターを含み得る。宿主ゲノムへの組み込みは、レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法で可能であり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、多くの異なる細胞型および標的組織において、高い形質導入効率が観察されている。
ウイルスベクターとしては、レンチウイルスベクター(例えば、HIVおよびFIVベースのベクター)、アデノウイルスベクター(例えば、AD100)、レトロウイルスベクター(例えば、マロニーマウス白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えば、HSV-2)、およびアデノ随伴ウイルス(AAV)ベクター、または他のプラスミドまたはウイルスベクタータイプが挙げられ得、例えば、米国特許第8,454,972号(アデノウイルスのための製剤、用量)、米国特許第8,404,658号(AAVのための製剤、用量)、および米国特許第5,846,946号(DNAプラスミドのための製剤、用量)からの製剤および用量、ならびにレンチウイルス、AAV、およびアデノウイルスを伴う臨床試験に関する臨床試験および刊行物からの製剤および用量が使用される。例えば、AAVの場合、投与経路、製剤、および投与量は、米国特許第8,454,972号およびAAVを伴う臨床試験と同様であり得る。アデノウイルスの場合、投与経路、製剤、および投与量は、米国特許第8,404,658号およびアデノウイルスを伴う臨床試験と同様であり得る。プラスミド送達の場合、投与経路、製剤、および投与量は、米国特許第5,846,946号およびプラスミドを伴う臨床試験と同様であり得る。用量は、平均70kgの個体(例えば、成体ヒト男性)に基づくか、または推定され得、患者、対象、異なる体重および種の哺乳動物に対して調整され得る。投与頻度は、年齢、性別、全般的な健康状態、患者もしくは対象の他の状態、および対処される特定の状態もしくは症状を含む通常の要因に応じて、医師または獣医(例えば、医師、獣医)の範疇である。ウイルスベクターは、目的の組織に注射され得る。細胞型特異的塩基エディターの場合、塩基エディターおよび任意のガイド核酸の発現は、細胞型特異的プロモーターによって駆動され得る。
外来エンベロープタンパク質を組み込むことによって、標的細胞の潜在的な標的集団を拡大することによって、レトロウイルスのトロピズムを変化させることができる。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には、高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入システムの選択は、標的組織に依存することになる。レトロウイルスベクターは、最大6~10kbの外来配列のパッケージング容量を有する、シス作用性の長鎖末端反復からなる。最小のシス作用性LTRは、ベクターの複製およびパッケージングに十分であり、次いで、治療用遺伝子を標的細胞に組み込んで、永続的な導入遺伝子の発現を提供するために使用される。広く使用されているレトロウイルスベクターとしては、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびこれらの組み合わせに基づくものが挙げられる(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992)、Johann et al.,J.Virol.66:1635-1640(1992)、Sommnerfelt et al.,Virol.176:58-59(1990)、Wilson et al.,J.Virol.63:2374-2378(1989)、Miller et al.,J.Virol.65:2220-2224(1991)、PCT/US94/05700を参照されたい)。
レトロウイルスベクター、特に、レンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、9kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して、低いウイルス力価をもたらし得る。一部の態様では、本開示の塩基エディターは、効率的なパッケージングおよびレトロウイルスベクターを介した標的細胞への送達を可能にするように十分なサイズである。一部の実施形態では、塩基エディターは、ガイド核酸および/または標的指向化可能なヌクレアーゼシステムの他の成分と一緒に発現された場合でも、効率的なパッキングおよび送達を可能にするようなサイズである。
パッケージング細胞は、典型的には、宿主細胞に感染することが可能なウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が含まれる。遺伝子療法に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、典型的には、パッケージングおよびその後の宿主への組み込みに必要な最小限のウイルス配列を含み、他のウイルス配列は、発現されるポリヌクレオチドのための発現カセットによって置き換えられる。欠損したウイルス機能は、典型的には、パッケージング細胞株によってトランスで供給される。例えば、遺伝子療法で使用されるアデノ随伴ウイルス(「AAV」)ベクターは、典型的には、宿主ゲノムへのパッケージングおよび組み込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子(すなわち、repおよびcap)をコードするがITR配列を欠くヘルパープラスミドを含む細胞株にパッケージングすることができる。細胞株は、ヘルパーとしてアデノウイルスで感染され得る。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミド由来のAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列を欠くために、かなりの量でパッケージ化されない。アデノウイルスによる汚染は、例えば、アデノウイルスがAAVよりも感受性が高い熱処理によって低減され得る。
一過的な発現が好ましい用途では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率を有することが可能であり、細胞分裂を必要としない。このようなベクターを用いて、高い力価および発現レベルが得られている。このベクターは、比較的単純なシステムで大量に産生され得る。アデノ随伴ウイルス(「AAV」)ベクターは、例えば、核酸およびペプチドのインビトロ産生において、インビボおよびエクスビボ遺伝子療法手順のために、標的核酸を用いて細胞を形質導入するために使用することもできる(例えば、West et al.,Virology 160:38-47(1987)、米国特許第4,797,368号、WO 93/24641、Kotin,Human Gene Therapy 5:793-801(1994)、Muzyczka,J.Clin.Invest.94:1351(1994)を参照されたい)。組換えAAVベクターの構築は、いくつかの刊行物に記載されており、米国特許第5,173,414号、Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985)、Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984)、Hermonat&Muzyczka,PNAS 81:6466-6470(1984)、およびSamulski et al.,J.Virol.63:03822-3828(1989)が挙げられる。
AAVは、パルボウイルス科に属する小型の一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのカプシドタンパク質とをコードする2つの遺伝子で構成され、両側に145bpの逆位末端反復(ITR)が隣接している。ビリオンは、3つのカプシドタンパク質であるVp1、Vp2、およびVp3から構成され、同じオープンリーディングフレームから1:1:10の比率で生成されるが、差次的スプライシング(Vp1)および選択的翻訳開始部位(それぞれ、Vp2およびVp3)から産生される。Vp3は、ビリオン内で最も豊富なサブユニットであり、ウイルスのトロピズムを定義する細胞表面での受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインは、Vp1の固有のN末端に特定されている。
wtAAVと同様に、組換えAAV(rAAV)は、隣接ベクター導入遺伝子カセットに対する145bpのシス作用性ITRを利用し、外来DNAのパッケージングのために最大4.5kbを提供する。感染後、rAAVは、本発明の融合タンパク質を発現することができ、環状ヘッド・トゥ・テール(head-to-tail)コンカテマーでエピソーム的に存在することによって、宿主ゲノムに組み込まれることなく持続する。このシステムをインビトロおよびインビボで使用したrAAVの成功例は多数あるが、遺伝子のコード配列の長さがwtAAVゲノムと同等またはそれ以上である場合、パッケージング容量の制限により、AAV媒介性遺伝子送達の使用が制限される。
ウイルスベクターは、用途に基づいて選択することができる。例えば、インビボでの遺伝子送達の場合、AAVは、他のウイルスベクターよりも有利であり得る。一部の実施形態では、AAVは低毒性を可能にし、これは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。一部の実施形態では、AAVは、宿主ゲノムに組み込まれないため、挿入変異誘発を引き起こす可能性が低くなる。アデノウイルスは、それらが強い免疫原性応答を誘導するため、ワクチンとして一般的に使用される。ウイルスベクターのパッケージング容量は、ベクターにパッケージングされ得る塩基エディターのサイズを制限し得る。
AAVは、2つの145塩基の逆位末端反復(ITR)を含む、約4.5Kbまたは4.75Kbのパッケージング容量を有する。これは、開示される塩基エディター、ならびにプロモーターおよび転写ターミネーターが、単一のウイルスベクターに適合され得ることを意味する。4.5Kbまたは4.75Kbを超える構築物は、ウイルス産生の著しい低下をもたらし得る。例えば、SpCas9はかなり大きいく、遺伝子自体が4.1Kbを超え、AAVへのパッケージングが困難になる。したがって、本開示の実施形態は、従来の塩基エディターよりも長さが短い開示される塩基エディターの利用を含む。一部の実施例では、塩基エディターは、4kb未満である。開示される塩基エディターは、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満であり得る。一部の実施形態では、本開示の塩基エディターの長さは、4.5kb以下である。
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。標的化される細胞に関してAAVの種類を選択することができ、例えば、脳または神経細胞を標的化するためのAAV血清型1、2、5、またはハイブリッドカプシドAAV1、AAV2、AAV5、またはそれらの任意の組み合わせを選択することができ、心組織を標的化する場合、AAV4を選択することができる。AAV8は、肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm,D.et al,J.Virol.82:5887-5911(2008)に見出すことができる。
一部の実施形態では、レンチウイルスベクターを使用して、キメラ抗原受容体を有する修飾免疫細胞(例えば、T細胞またはNK細胞)を形質導入する。レンチウイルスは複雑なレトロウイルスであり、分裂細胞と分裂終了細胞の両方において感染し、それらの遺伝子を発現する能力を有する。最も一般的に知られているレンチウイルスは、ヒト免疫不全ウイルス(HIV)であり、他のウイルスのエンベロープ糖タンパク質を使用して、広範囲の細胞型を標的化する。
レンチウイルスは、以下のように調製することができる。pCasES10(レンチウイルス転写プラスミド骨格を含む)をクローニングした後、トランスフェクションの前日に、低継代(p=5)のHEK293FTを、10%ウシ胎仔血清を含み抗生物質を含まないDMEM中で、T-75フラスコ内で50%コンフルエンスに播種した。20時間後、培地をOptiMEM(無血清)培地に交換し、4時間後にトランスフェクションを行った。細胞を、10μgのレンチウイルス導入プラスミド(pCasES10)および以下のパッケージングプラスミドを用いてトランスフェクトする:5μgのpMD2.G(VSV-gシュードタイプ)、および7.5μgのpsPAX2(gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50μlのLipofectamine 2000および100μlのPlus試薬)を含む4mLのOptiMEM中で行うことができる。6時間後、培地を、10%胎仔ウシ血清を含み抗生物質を含まないDMEMに交換する。これらの方法は、細胞培養中に血清を使用するが、無血清の方法が好ましい。
レンチウイルスは、以下のように精製することができる。ウイルス上清を48時間後に回収する。上清は、最初にデブリを除去し、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、超遠心分離機で、24,000rpmで2時間スピンする。ウイルスペレットを、50μlのDMEM中に、4℃で一晩再懸濁する。次いで、それらをアリコートし、-80℃ですぐに凍結する。
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小非霊長類レンチウイルスベクターも企図される。別の実施形態では、RetinoStat(登録商標)は、ウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子療法ベクターであり、血管新生抑制タンパク質であるエンドスタチンおよびアンジオスタチンを発現し、これは、網膜下注射によって送達されることが企図される。別の実施形態では、自己不活性化レンチウイルスベクターの使用が企図される。
システムの任意のRNA、例えば、ガイドRNAまたは塩基エディターをコードするmRNAは、RNAの形態で送達され得る。塩基エディターをコードするmRNAは、インビトロ転写を使用して生成することができる。例えば、ヌクレアーゼのmRNAは、以下のエレメントを含むPCRカセットを使用して合成することができる:T7プロモーター、任意のkozak配列(GCCACC)、ヌクレアーゼ配列、および3’UTR(例えば、βグロビン-ポリAテール由来の3’UTR)。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーター、続いて、配列「GG」、およびガイドポリヌクレオチド配列を含むカセットからのインビトロ転写を使用して転写することもできる。
発現を増強し、可能性のある毒性を低減するために、塩基エディターのコード配列および/またはガイド核酸は、例えば、シュードUまたは5-メチルCを使用して、1つ以上の修飾ヌクレオシドを含むように修飾され得る。
AAVベクターの小さなパッケージング容量は、このサイズを超えるいくつかの遺伝子の送達および/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質を2つ以上の断片に分割することによって対処することができ、N末端断片は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。次いで、これらの断片は、2つ以上のAAVベクターにパッケージングされる。本明細書で使用される場合、「インテイン」とは、隣接するN末端およびC末端のエクステイン(例えば、連結される断片)をライゲーションする自己スプライシングタンパク質のイントロン(例えば、ペプチド)を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntNおよびIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステインおよびC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。
本発明の融合タンパク質の断片は、長さが変化し得る。一部の実施形態では、タンパク質断片は、2アミノ酸長~約1000アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約5アミノ酸長~約500アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約20アミノ酸長~約200アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約10アミノ酸長~約100アミノ酸長の範囲である。他の長さの好適なタンパク質断片は、当業者には明らかであろう。
一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半分(5’末端および3’末端、または頭部および尾部)に分割することによって生成され、カセットの各半分は、単一のAAVベクター(5kb未満)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクター、続いて、(1)5’ゲノムと3’ゲノムとの間の相同組換え(HR)(デュアルAAV重複ベクター)、(2)5’ゲノムと3’ゲノムとのITR媒介性テール・トゥ・ヘッド(tail-to-head)コンカテマー化(デュアルAAVトランススプライシングベクター)、または(3)これらの2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって同じ細胞を同時感染させると達成される。インビボでのデュアルAAVベクターの使用は、全長タンパク質の発現をもたらす。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kb超の導入遺伝子のための効率的かつ実行可能な遺伝子導入戦略を表す。
インテイン
インテイン(介在タンパク質)は、タンパク質スプライシングとして知られるプロセスを行う様々な多様な生物に見られる自動処理ドメインである。タンパク質スプライシングは、ペプチド結合の切断および形成の両方からなる多段階の生化学反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見出されるが、インテインは、事実上、任意のポリペプチド骨格を化学的に操作するために使用することもできる。
タンパク質スプライシングでは、インテインは、2つのペプチド結合を切断することによって前駆体ポリペプチドから自ら切除し、それによって、新たなペプチド結合の形成を介して隣接するエクセイン(外部タンパク質)配列をライゲーションする。この再編成は、翻訳後(または、場合によっては翻訳時(co-translationally))に起こる。インテイン媒介性タンパク質スプライシングは、インテインドメインのフォールディングのみを必要とする、自発的に起こる。
インテインの約5%はスプリットインテインであり、これらは2つの別個のポリペプチド(N-インテインおよびC-インテイン)として転写および翻訳され、それぞれが1つのエクステインに融合される。翻訳時に、インテイン断片は、正準インテイン構造に自発的かつ非共有結合的に構築され、トランスでタンパク質スプライシングを行う。タンパク質スプライシングのメカニズムは、インテイン-エクステイン接合部における2つのペプチド結合の切断、およびN-エクステインとC-エクステインとの間の新しいペプチド結合の形成をもたらす一連のアシル転位反応を伴う。このプロセスは、N-エクステインとインテインのN末端とを結合するペプチド結合の活性化によって開始される。ほぼすべてのインテインは、C末端N-エクステイン残基のカルボニル炭素を攻撃するシステインまたはセリンを、N末端に有する。このN~O/Sアシル転位(acyl-shift)は、一般に見出されるアスパラギン酸とともに、保存されたスレオニンおよびヒスチジン(TXXHモチーフと称される)によって促進され、直鎖(チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはスレオニンである第1のC-エクステイン残基(+1)の求核攻撃によるトランス(チオ)エステル化に供される。得られた分枝(チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化という独自の変換によって解決される。このプロセスは、ヒスチジン(高度に保存されたHNFモチーフ中に見出される)および最後から2番目のヒスチジンによって促進され、アスパラギン酸もまた関与し得る。このスクシンイミド形成反応は、反応性複合体からインテインを切除し、非ペプチド結合を介して結合したエクステインを残す。この構造は、インテイン非依存的な様式で急速に安定なペプチド結合に再編成される。
一部の実施形態では、ヌクレアーゼ(例えば、Cas9)の一部分または断片がインテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。一部の実施形態では、融合タンパク質の一部分または断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、およびカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。一部の実施形態では、塩基エディターのN末端断片(例えば、ABE、CBE)は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。これらの断片は、次いで、2つ以上のAAVベクターにパッケージングされる。一部の実施形態では、インテインのN末端は、融合タンパク質のC末端に融合され、インテインのC末端は、AAVカプシドタンパク質のN末端に融合される。
一実施形態では、インテインは、AAVカプシドタンパク質上に移植されるシチジンデアミナーゼまたはアデノシンデアミナーゼ塩基エディタータンパク質の断片または部分を接合するために利用される。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntNおよびIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステインおよびC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。
一部の実施形態では、ABEは、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基において、N末端断片およびC末端断片に分割された。これらの領域は、Cas9結晶構造解析によって特定されたループ領域に対応する。各断片のN末端はインテイン-Nに融合され、各断片のC末端は、アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590でインテイン-Cに融合される(これらは、以下の配列で、太字で示されている)。
核酸塩基エディターの使用
腫瘍細胞と会合した標的抗原は、健常な免疫細胞上で発現されてもよい。したがって、修飾免疫細胞(例えば、CAR-T)細胞を使用して腫瘍細胞上の抗原を標的化することで、その抗原も発現する健常な免疫細胞の死滅(フラトリサイドまたは自己死滅として知られる)がもたらされ得る。修飾免疫細胞を、修飾免疫細胞上の標的抗原(例えばCD2)の発現を低減または排除してフラトリサイド耐性を提供し得る塩基エディターと組み合わせて使用することは、治療および基礎研究における応用とともに遺伝子修正を使用するための新しい戦略を提供する。
本開示は、フラトリサイド耐性修飾免疫細胞を産生するための方法を提供する。一部の実施形態では、核酸塩基エディター(例えば、アデノシンデアミナーゼ塩基エディターまたはシチジンデアミナーゼ塩基エディター)と1つ以上のガイドRNAとを用いて、健康な対象またはドナーから得られた免疫細胞(例えば、T細胞またはNK細胞)を編集して、免疫細胞(例えば、T細胞またはNK細胞)上の標的抗原(例えば、CD2)の発現を低減または排除することを含む方法が提供される。次いで、免疫細胞は、標的抗原(例えば、CD2)を対象とするキメラ抗原受容体を用いて形質導入される。得られた修飾免疫細胞(例えば、CAR-T)は、フラトリサイド耐性であり、健常な免疫細胞を標的化することなく、腫瘍細胞を標的化することができる。一部の実施形態では、フラトリサイド耐性修飾免疫細胞は、実施例2に提供されるように産生される。一部の実施形態では、フラトリサイド耐性CD2 CAR-T細胞を産生する方法が提供される。
本開示はまた、本明細書に提供される修飾免疫細胞を使用して、疾患(例えば、T細胞またはNK細胞悪性腫瘍)と診断された対象を治療するための方法を提供する。一部の実施形態では、有効量の本明細書に提供されるように産生された修飾免疫細胞を、疾患(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または疾患を有する傾向がある対象に投与することを含む方法が提供される。本開示は、デアミナーゼ媒介性遺伝子編集によって修正され得る標的とされた抗原と関連するT細胞またはNK細胞悪性腫瘍を治療するための方法を提供する。本明細書に提供される戦略と修飾免疫細胞とを用いて治療することができる好適な疾患は、本開示に基づいて、当業者には明らかであろう。
標的ヌクレオチド配列中の核酸塩基を編集するための塩基エディターまたは塩基エディターシステムを使用する方法が本明細書に提供される。一部の実施形態では、(例えば、デアミナーゼ、Cas9ドメイン、および1つ以上のガイドRNAを含む)塩基エディターシステムの活性は、スプライス部位の破壊をもたらすか、または標的ヌクレオチド配列への未熟終止コドンの導入をもたらす。
一部の実施形態では、本発明に提供されるデアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)は、DNAのデオキシアデノシン残基を脱アミノ化することができる。本開示の他の態様は、デアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)および特定のヌクレオチド配列に結合することができるドメイン(例えば、Cas9またはCpf1タンパク質)を含む融合タンパク質を提供する。例えば、アデノシンは、典型的には、シトシン残基と塩基対を形成するイノシン残基に変換され得る。かかる融合タンパク質は、とりわけ、核酸配列の標的化編集に有用である。かかる融合タンパク質は、インビトロでのDNAの標的化された編集(例えば、変異細胞または動物の生成)のために使用することができ、標的化された変異の導入(例えば、エクスビボでの細胞における遺伝子欠陥の修正、例えば、その後、同じ対象もしくは別の対象に再導入される対象から得られた細胞における遺伝子欠陥の修正)のために使用することができ、インビボでの標的化された変異の導入(例えば、遺伝子欠陥の修正、またはGからAもしくはTからCの変異の疾患関連遺伝子における非活性化変異の導入)ために使用することができ、本明細書に提供される核酸塩基エディターを使用して治療することができる。本開示は、デアミナーゼおよび核酸塩基エディターを利用する、修飾免疫細胞、融合タンパク質、核酸、ベクター、組成物、方法、キット、システムなどを提供する。
核酸を編集するための方法
本開示の一部の態様は、核酸を編集するための方法を提供する。一部の実施形態では、本方法は、核酸の核酸塩基(例えば、二本鎖DNA配列の塩基対)を編集するための方法である。一部の実施形態では、本方法は、a)核酸(例えば、二本鎖DNA配列)の標的領域を、塩基エディター(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼに融合されたCas9ドメイン)とガイド核酸(例えば、gRNA)とを含む複合体と接触させるステップであって、標的領域が標的核酸塩基対を含む、接触させるステップと、b)当該標的領域の鎖分離を誘導するステップと、c)標的領域の一本鎖における当該標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換するステップと、d)当該標的領域の1つ以下の鎖を切断するステップであって、第1の核酸塩基塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基によって置き換えられる、切断するステップと、を含む。一部の実施形態では、本方法は、核酸における20%未満のインデル形成をもたらす。一部の実施形態では、ステップbが省略されることを理解されたい。一部の実施形態では、本方法は、19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%、または0.1%未満のインデル形成をもたらす。一部の実施形態では、本方法は、第2の核酸塩基が、第4の核酸塩基に相補的である第5の核酸塩基で置き換え、それによって、意図された編集された塩基対(例えば、C・GからT・A)を生成することをさらに含む。一部の実施形態では、意図された塩基対の少なくとも5%が編集される。一部の実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。
一部の実施形態では、標的ヌクレオチドにおける意図された産物と意図されない産物との比率は、少なくとも2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、もしくは200:1、またはそれ以上である。一部の実施形態では、インデル形成に対する意図された変異の比率は、1:1、10:1、50:1、100:1、500:1、もしくは1000:1、またはそれ以上である。一部の実施形態では、カットされた一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズする。一部の実施形態では、カットされた一本鎖は、第1の核酸塩基を含む鎖と反対側である。一部の実施形態では、塩基エディターは、Cas9ドメインを含む。一部の実施形態では、塩基エディターは、未編集鎖を保護または結合する。一部の実施形態では、塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、意図された編集された塩基対は、PAM部位の上流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。一部の実施形態では、意図される編集された塩基対は、PAM部位の下流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。一部の実施形態では、本方法は、正準(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーを含む。一部の実施形態では、リンカーは、1~25アミノ酸長である。一部の実施形態では、リンカーは、5~20アミノ酸長である。一部の実施形態では、リンカーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。一実施形態では、リンカーは、32アミノ酸長である。別の実施形態では、「長いリンカー」は、少なくとも約60アミノ酸長である。他の実施形態では、リンカーは、約3~100アミノ酸長である。一部の実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチド長である。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。一部の実施形態では、意図された編集された塩基対は、標的ウィンドウ内にある。一部の実施形態では、標的ウィンドウは、意図された編集された塩基対を含む。一部の実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを使用して実施される。一部の実施形態では、標的ウィンドウは、メチル化ウィンドウである。
一部の実施形態では、本開示は、ヌクレオチドを編集するための方法を提供する。一部の実施形態では、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。一部の実施形態では、本方法は、a)二本鎖DNA配列の標的領域を、塩基エディターとガイド核酸(例えばgRNA)とを含む複合体と接触させることであって、標的領域が、標的核酸塩基対を含む、接触させることと、b)当該標的領域の鎖分離を誘導することと、c)標的領域の一本鎖における当該標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換することと、d)当該標的領域の1つ以下の鎖を切断することであって、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基によって置き換えられ、第2の核酸塩基が、第4の核酸塩基に相補的である第5の核酸塩基で置き換えられ、それによって、意図された編集された塩基対を生成し、意図された編集された塩基対を生成する効率が、少なくとも5%である、切断することと、を含む。一部の実施形態では、ステップbが省略されることを理解されたい。一部の実施形態では、意図された塩基対の少なくとも5%が編集される。一部の実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。一部の実施形態では、本明細書に記載の方法による塩基編集は、任意の特定の遺伝子部位において、少なくとも10%の塩基変換効率を有し得る。一部の実施形態では、本明細書に記載の方法による塩基編集は、任意の特定の遺伝子部位において、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、または少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%、96%、97%、98%、または少なくとも99%の塩基変換効率を有し得る。一部の実施形態では、本明細書に記載の方法による塩基編集は、任意の特定の遺伝子部位において、少なくとも70%の塩基変換効率を有し得る。一部の実施形態では、本明細書に記載の方法による塩基編集は、任意の特定の遺伝子部位において、少なくとも80%の塩基変換効率を有し得る。一部の実施形態では、本明細書に記載の方法による塩基編集は、任意の特定の遺伝子部位において、少なくとも90%の塩基変換効率を有し得る。
一部の実施形態では、本方法は、19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%、または0.1%未満のインデル形成を引き起こす。一部の実施形態では、標的ヌクレオチドにおける意図された産物:意図されない産物の比率は、少なくとも2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、もしくは200:1、またはそれ以上である。一部の実施形態では、インデル形成に対する意図された変異の比率は、1:1、10:1、50:1、100:1、500:1、もしくは1000:1、またはそれ以上である。一部の実施形態では、カットされた一本鎖は、ガイド核酸にハイブリダイズする。一部の実施形態では、カットされた一本鎖は、第1の核酸塩基を含む鎖と反対側である。一部の実施形態では、核酸塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、意図された編集された塩基対は、PAM部位の上流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。一部の実施形態では、意図される編集された塩基対は、PAM部位の下流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。一部の実施形態では、本方法は、正準(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーを含む。一部の実施形態では、リンカーは、1~25アミノ酸長である。一部の実施形態では、リンカーは、5~20アミノ酸長である。一部の実施形態では、リンカーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。例えば、一部の実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは、標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチド長である。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。一部の実施形態では、意図された編集された塩基対は、標的ウィンドウ内で生じる。一部の実施形態では、標的ウィンドウは、意図された編集された塩基対を含む。一部の実施形態では、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれか1つである。
薬学的組成物
一部の態様では、本発明は、本明細書に記載の遺伝子修飾免疫細胞、塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のうちのいずれかを含む薬学的組成物を提供する。より具体的には、薬学的組成物が本明細書に提供され、遺伝子修飾免疫細胞またはかかる免疫細胞の集団を含み、キメラ抗原受容体(CAR)を発現し、当該修飾免疫細胞またはその集団は、少なくとも1つの編集された遺伝子を有して、フラトリサイド耐性を提供するか、修飾免疫細胞の機能を増強するか、または修飾免疫細胞の免疫抑制もしくは免疫阻害を低減し、編集された遺伝子の発現は、ノックアウトまたはノックダウンされる。一部の実施形態では、少なくとも1つの編集遺伝子は、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、PDCD1/PD1、CBLB、TGFBR2、ZAP70、NFATc1、TET2、またはそれらの組み合わせである。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123が編集される。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123は、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPDCD1/PD1から選択される1つ以上の遺伝子と組み合わせて編集される。
一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD5を欠くかまたは減少したレベルのCD5を有し、CD5キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD7を欠くかまたは減少したレベルのCD7を有し、CD7キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD33を欠くかまたは減少したレベルのCD33を有し、CD33キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD3を欠くかまたは減少したレベルのCD3を有し、CD3キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD123を欠くかまたは減少したレベルのCD123を有し、CD123キメラ抗原受容体を発現する。
一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD5、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPDCD1/PD1から選択される少なくとも1つの編集された遺伝子を欠くかまたは減少したレベルを有し、CD5キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD7、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くかまたは減少したレベルを有し、CD7キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD33、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くかまたは減少したレベルを有し、CD33キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD3、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くかまたは減少したレベルを有し、CD3キメラ抗原受容体を発現する。一部の実施形態では、薬学的組成物は、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団を含み、CD123、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くかまたは減少したレベルを有し、CD123キメラ抗原受容体を発現する。
本発明の薬学的組成物は、既知の技術に従って調製することができる。例えば、Remington,The Science And Practice of Pharmacy(21st ed.2005)を参照されたい。一般に、免疫細胞またはその集団は、投与または貯蔵の前に、好適な担体と混合され、一部の実施形態では、薬学的組成物は、薬学的に許容される担体をさらに含む。好適な薬学的に許容される担体は、概して、不活性物質を含み、薬学的組成物を対象に投与するのを助けるか、薬学的組成物を送達可能な調製物に加工するのを助けるか、または投与前に薬学的組成物を保管するのを助ける。薬学的に許容される担体は、製剤の形態、一貫性、粘性、pH、薬物動態、溶解性を、安定化、最適化、またはその他変化させ得る薬剤を含むことができる。かかる薬剤には、緩衝剤、湿潤剤、乳化剤、希釈剤、封入剤、および皮膚浸透促進剤が含まれる。例えば、担体には、生理食塩水、緩衝生理食塩水、デキストロース、アルギニン、スクロース、水、グリセロール、エタノール、ソルビトール、デキストラン、カルボキシメチルセルロースナトリウム、およびそれらの組み合わせが含まれ得るが、これらに限定されない。
薬学的に許容される担体としての役割を果たすことができる材料のいくつかの非限定的な例としては、以下が挙げられる:(1)糖類(例えば、乳糖、グルコースおよびスクロース)、(2)デンプン(例えば、トウモロコシデンプンおよびジャガイモデンプン)、(3)セルロースおよびその誘導体(例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、および酢酸セルロース)、(4)粉末トラガント、(5)麦芽、(6)ゼラチン、(7)潤滑剤(例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルク)、(8)賦形剤(例えば、ココアバターおよび坐剤ワックス)、(9)油(例えば、ピーナッツ油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油、および大豆油)、(10)グリコール(例えば、プロピレングリコール)、(11)ポリオール(例えば、グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG))、(12)エステル(例えば、オレイン酸エチルおよびラウリン酸エチル)、(13)寒天、(14)緩衝剤(例えば、水酸化マグネシウムおよび水酸化アルミニウム)、(15)アルギン酸、(16)パイロジェンフリー水、(17)等張生理食塩水、(18)リンゲル溶液、(19)エチルアルコール、(20)pH緩衝溶液、(21)ポリエステル、ポリカーボネート、および/またはポリ酸無水物、(22)膨張剤(例えば、ポリペプチドおよびアミノ酸)、(23)血清アルコール(例えば、エタノール)、ならびに(23)薬学的製剤に用いられる他の非毒性の適合性物質。湿潤剤、着色剤、剥離剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤、および抗酸化剤も、製剤中に存在してもよい。
薬学的組成物は、製剤のpHを、生理学的pHを反映する所定のレベルに(例えば、約5.0~約8.0の範囲に)維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体製剤に使用されるpH緩衝化合物は、アミノ酸、またはアミノ酸の混合物(例えば、ヒスチジン、またはヒスチジンおよびグリシンなどのアミノ酸の混合物)であり得る。あるいは、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベルに(例えば、約5.0~約8.0の範囲に)維持し、かつカルシウムイオンをキレートしない薬剤である。かかるpH緩衝化合物の例示的な例としては、イミダゾールおよび酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに好適な任意の量で存在してもよい。
薬学的組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、張力、オスモラリティ、および/または浸透圧)を、レシピエント個体の血流および血液細胞で許容されるレベルに調節する化合物を含み得る。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する、当業者に既知または利用可能な任意の化合物であり得る。当業者は、本発明の製剤で使用される所与の浸透圧調節剤の適合性を経験的に決定することができる。好適な種類の浸透圧調節剤の例示的な例としては、塩(例えば、塩化ナトリウムおよび酢酸ナトリウム)、糖(例えば、スクロース、デキストロース、およびマンニトール)、アミノ酸(例えば、グリシン)、ならびにこれらの薬剤および/または薬剤の種類のうちの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在してもよい。
修飾免疫細胞またはその集団、および担体に加えて、本発明の薬学的組成物は、疾患の治療に有用な少なくとも1つの追加の治療剤を含むことができる。例えば、本明細書に記載の薬学的組成物の一部の実施形態は、化学療法剤をさらに含む。一部の実施形態では、薬学的組成物は、サイトカインペプチドまたはサイトカインペプチドをコードする核酸配列をさらに含む。一部の実施形態では、修飾免疫細胞またはその集団を含む薬学的組成物は、追加の治療薬とは別に投与され得る。
一部の実施形態では、少なくとも1つの追加の治療剤は、1つ以上の追加の修飾免疫細胞、またはその修飾免疫細胞の1つ以上の集団である。一部の実施形態では、1つ以上の追加の修飾免疫エフェクター細胞は、編集された遺伝子の発現をノックアウトまたはノックダウンするために少なくとも1つの編集された遺伝子を含む。一部の実施形態では、少なくとも1つの編集された遺伝子は、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、PD1、またはそれらの組み合わせである。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123が編集される。一部の実施形態では、CD3、CD5、CD7、CD33、またはCD123は、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、および/またはPD1から選択される1つ以上の遺伝子と組み合わせて編集される。
一部の実施形態では、薬学的組成物は、その修飾免疫細胞の2つ以上の集団を含む。一部の実施形態では、薬学的組成物は、1)CD5、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD5キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、2)CD7、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD7キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、を含む。
一部の実施形態では、薬学的組成物は、1)CD33、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD33キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、2)CD123、およびTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD123キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、を含む。
本発明の薬学的組成物を使用して、自己または同種免疫細胞免疫療法に応答する任意の疾患または状態を治療することができる。例えば、薬学的組成物は、一部の実施形態では、腫瘍の治療に有用である。一部の実施形態では、腫瘍は、固形腫瘍である。他の実施形態では、腫瘍は、液体腫瘍である。一部の実施形態では、腫瘍は、血液がんである。一部の実施形態では、血液がんは、B細胞がんであり、一部の実施形態では、B細胞がんは、多発性骨髄腫である。一部の実施形態では、B細胞がんは、再発/難治性多発性骨髄腫の再発である。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。
腫瘍の非限定的な例としては、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫が挙げられる。一部の実施形態では、腫瘍は、T細胞急性リンパ芽球性白血病(T-ALL)である。一部の実施形態では、腫瘍は、急性骨髄性白血病(AML)である。
一部の実施形態では、腫瘍(例えば、白血病)を有する対象、またはそれを発症する傾向がある対象には、1)CD5、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPDCD1/PD1から選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD5キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、2)CD7、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD7キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、3)CD33、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD33キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、4)CD123、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2Mから選択される少なくとも1つの編集された遺伝子を欠くか、または減少したレベルを有し、かつCD123キメラ抗原受容体を発現する、修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団と、のうちの1つ以上が有効量で投与される。
本発明の遺伝子修飾免疫細胞の治療的使用に関する考慮事項の1つは、最適または満足のいく効果を達成するために必要な細胞の量である。投与される細胞の量は、処置される対象によって異なり得る。一実施形態では、10~1010、10~10、または10~10個の本発明の遺伝子修飾免疫応答性細胞が、ヒト対象に投与される。一部の実施形態では、少なくとも約1x10、2x10、3x108、4x10、および5x10個の本発明の遺伝子修飾免疫細胞が、ヒト対象に投与される。正確な有効用量の決定は、各個々の対象の要因(サイズ、年齢、性別、体重、および状態を含む)に基づいてもよい。用量は、本開示および当該技術分野における知識から、当業者によって容易に確かめられ得る。
当業者は、組成物中のおよび本発明の方法において投与される、細胞の数ならびに任意選択的な添加剤、ビヒクル、および/または担体の量を容易に決定することができる。典型的には、添加剤(活性免疫細胞に加えて)は、リン酸緩衝生理食塩水中0.001~50%(重量)溶液の量で存在し、活性成分は、マイクログラム~ミリグラムのオーダーで、例えば、約0.0001~約5重量%、好ましくは約0.0001~約1重量%、さらにより好ましくは約0.0001~約0.05重量%、または約0.001~約20重量%、好ましくは約0.01~約10重量%、さらにより好ましくは約0.05~約5重量%で存在する。もちろん、動物またはヒトに投与される任意の組成物、および任意の特定の投与方法に対して、したがって、毒性を決定すること(例えば、好適な動物モデル(例えば、マウスなどのげっ歯類)における致死量(LD)およびLD50を決定することによる)、ならびに好適な応答を誘発する組成物の投薬量、その中の成分の濃度、および組成物の投与のタイミングを決定することが好ましい。かかる決定は、当業者の知識、本開示、および本明細書で引用される文書から、過度の実験を必要としない。また、順次投与の時間は、過度の実験なしに確かめることができる。
一実施形態では、本明細書に記載の方法および組成物は、CARを発現する操作されたT細胞を生成する際に使用されてもよく、かつ1つ以上の塩基編集された修飾を有してもよく、そのため、操作されたT細胞が標的に対して特異的な免疫応答を開始することができるようになる。CARは、特異的に抗原標的を対象としてもよく、抗原は、宿主内の細胞によって提示され得る。一部の実施形態では、免疫応答は、細胞傷害性を包含する。一部の実施形態では、操作されたT細胞は、その標的に対する増強された細胞傷害性応答を有する。一部の実施形態では、操作されたT細胞は、操作されていないT細胞と比較して、その標的に対する増強された細胞傷害性応答を誘導する。一部の実施形態では、操作されたT細胞は、操作されていない細胞と比較して、少なくとも1.1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、またはそれ以上の増強された細胞傷害性応答を示す。一部の実施形態では、操作されたT細胞は、操作されていない細胞よりも、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%、少なくとも200%、少なくとも500%、または少なくとも1000%多く、標的細胞を死滅させることができる。一部の実施形態では、T細胞は、より高いメモリ応答を誘発することができる。一部の実施形態では、T細胞は、操作されていない細胞よりも低いレベルの炎症性サイトカインを誘導することができ、すなわち、操作された細胞が、サイトカインストーム応答を引き起こさない。
一部の実施形態では、操作されたT細胞は、同種宿主に投与され、操作されたT細胞は、宿主による拒絶を有しない。一部の実施形態では、同種T細胞は、宿主による無視可能なまたは最小限の拒絶を誘発する。一部の実施形態では、操作されたT細胞は、フラトリサイド耐性を有する。
一部の実施形態では、薬学的組成物は、対象への送達のために製剤化される。本明細書に記載の薬学的組成物を投与する好適な経路としては、局所、皮下、皮内、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与が挙げられるが、これらに限定されない。
一部の実施形態では、本明細書に記載の薬学的組成物は、疾患部位(例えば、腫瘍部位)に局所的に投与される。一部の実施形態では、本明細書に記載の薬学的組成物は、注射によって、カテーテルによって、坐剤によって、またはインプラントによって、対象に投与され、インプラントは、シアラスティック(sialastic)膜または繊維などの膜を含む、多孔性、非多孔性、またはゲル状物質である。
他の実施形態では、本明細書に記載の薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えば、Langer,1990、Science 249:1527-1533、Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201、Buchwald et al.,1980,Surgery 88:507、Saudek et al.,1989,N.Engl.J.Med.321:574を参照されたい)。別の実施形態では、ポリマー材料を使用することができる。(例えば、Medical Applications of Controlled Release(Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974)、Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984)、Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照されたい。また、Levy et al.,1985,Science 228:190、During et al.,1989,Ann.Neurol.25:351、Howard et al.,1989,J.Neurosurg.71:105を参照されたい)。他の制御放出システムは、例えば、上記のLangerで論じられている。
一部の実施形態では、薬学的組成物は、対象(例えば、ヒト)への静脈内または皮下投与に適した組成物として、通常の手順に従って製剤化される。一部の実施形態では、注射による投与のための薬学的組成物は、可溶化剤としての滅菌等張使用における溶液、および注射部位の疼痛を緩和するためのリグノカインなどの局所麻酔剤である。一般に、成分は、例えば、活性剤の量を示すアンプルまたはサシェなどの密封容器中の乾燥した凍結乾燥粉末または水を含まない濃縮物として、別々にまたは単位剤形で一緒に混合されて供給される。医薬品が注入によって投与される場合、医薬品は、滅菌医薬品グレードの水または生理食塩水を含む注入ボトルを用いて分注され得る。薬学的組成物が注射によって投与される場合、投与前に成分が混合され得るように、注射用の滅菌水または生理食塩水のアンプルが提供され得る。
全身投与のための薬学的組成物は、液体(例えば、滅菌生理食塩水、乳酸リンゲル溶液、またはハンクス溶液)であってもよい。加えて、薬学的組成物は、固体形態であってもよく、使用の直前に再溶解または懸濁され得る。凍結乾燥形態も企図される。薬学的組成物は、脂質粒子または小胞(例えば、非経口投与にも好適なリポソームまたは微結晶)内に含まれ得る。粒子は、組成物がその中に含まれている限り、単層(unilamellar)または多層(plurilamellar)などの任意の好適な構造の粒子であり得る。化合物は、融合脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)の陽イオン性脂質を含む「安定化プラスミド脂質粒子」(SPLP)に封入され、ポリエチレングリコール(PEG)コーティングによって安定化され得る(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47を参照されたい)。かかる粒子および小胞には、N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチル硫酸塩または「DOTAP」などの正に帯電した脂質が特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号、同第4,906,477号、同第4,911,928号、同第4,917,951号、同第4,920,016号、および同第4,921,757号を参照されたい(それらの各々は、参照により本明細書に援用される)。
本明細書に記載の薬学的組成物は、例えば、単位用量として投与または包装され得る。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単位投薬量として好適な物理的に分離された単位を指し、各単位は、必要な希釈剤(すなわち、担体またはビヒクル)と関連して所望の治療効果がもたらされるように計算された所定の量の活性物質を含む。
さらに、薬学的組成物は、薬学的キットとして提供され得、(a)凍結乾燥形態の本発明の化合物を含む容器、および(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構築または希釈に使用される滅菌物)を含む第2の容器を含む。任意選択的に、かかる容器に付随するものが、医薬品または生物学的製品の製造、使用、または販売を規制する政府機関によって規定される形態の通知であってもよく、この通知は、ヒトへの投与のための製造、使用、または販売の機関による承認を反映する。
別の態様では、上に記載の疾患の治療に有用な材料を含む製造品(article of manufacture)が含まれる。一部の実施形態では、製造品は、容器およびラベルを含む。好適な容器としては、例えば、ボトル、バイアル、注射器、および試験管が挙げられる。容器は、ガラスまたはプラスチックなどの様々な材料から形成され得る。一部の実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する、静脈内輸液バッグまたはバイアルであり得る。組成物中の活性剤は、本発明の化合物である。一部の実施形態では、容器上の、または容器に付随するラベルは、組成物が、選択された疾患を治療するために使用されることを示す。製造品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器をさらに含み得る。これには、商業および使用者の観点から望ましい他の材料がさらに含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用説明書を含む添付文書が挙げられる。
一部の実施形態では、本明細書に記載の融合タンパク質、gRNA、および/または複合体のいずれかは、薬学的組成物の一部として提供される。一部の実施形態では、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。一部の実施形態では、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。一部の実施形態では、薬学的組成物は、gRNAとカチオン性脂質との複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボ核タンパク質複合体を含む。一部の実施形態では、薬学的組成物は、gRNA、核酸プログラマブルDNA結合タンパク質、カチオン性脂質、および薬学的に許容される賦形剤を含む。薬学的組成物は、任意選択的に、1つ以上の追加の治療活性物質を含むことができる。
一部の実施形態では、本明細書に提供される組成物は、対象内の標的ゲノム修飾をもたらすように、対象に(例えば、ヒト対象に)投与される。一部の実施形態では、細胞は、対象から得られ、本明細書に提供される薬学的組成物のいずれかと接触する。一部の実施形態では、対象から取り出され、エクスビボで薬学的組成物と接触させた細胞は、任意選択的に、所望のゲノム修飾が細胞内で実施または検出された後、対象に再導入される。ヌクレアーゼを含む薬学的組成物を送達する方法は既知であり、例えば、米国特許第6,453,242号、同第6,503,717号、同第6,534,261号、同第6,599,692号、同第6,607,882号、同第6,689,558号、同第6,824,978号、同第6,933,113号、同第6,979,539号、同第7,013,219号、および同第7,163,824号に記載されている(それらのすべての開示は、それらの全体が参照により本明細書に援用される)。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に好適な薬学的組成物を対象とするが、かかる組成物が、概して、あらゆる種類の動物または生物への投与に(例えば、獣医学的使用に)好適であることが、当業者によって理解されるであろう。
組成物が様々な動物への投与に好適であるようにするため、ヒトへの投与に好適な薬学的組成物を改変することは十分に理解されており、通常の熟練した獣医薬理学者は、もしあったとしても単に通常の実験で、かかる改変を設計および/または実施することができる。薬学的組成物の投与が企図される対象としては、ヒトおよび/もしくは他の霊長類、哺乳類、家畜化された動物、ペット、ならびに商業的に関連する哺乳類(例えば、ウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/もしくはラット)、ならびに/または鳥類(ニワトリ、アヒル、ガチョウ、および/もしくはシチメンチョウなどの商業的に関連する鳥類を含む)が挙げられるが、これらに限定されない。
本明細書に記載の薬学的組成物の製剤は、薬理学の分野で既知のまたは今後開発される任意の方法によって調製することができる。一般に、かかる調製方法は、活性成分を、賦形剤および/または1つ以上の他の副成分と会合させるステップと、次いで、必要および/または望ましい場合、製品を所望の単回用量単位または複数回用量単位に成形および/または包装するステップと、を含む。薬学的製剤は、薬学的に許容される賦形剤をさらに含むことができ、本明細書で使用される場合、所望の特定の剤形に適した、あらゆる溶媒、分散媒、希釈剤、または他の液体ビヒクル、分散助剤または懸濁助剤、表面活性剤、等張剤、増粘剤または乳化剤、防腐剤、固体結合剤、潤滑剤などが含まれる。Remington’s The Science and Practice of Pharmacy,21st Edition,A.R.Gennaro(Lippincott,Williams&Wilkins,Baltimore,MD,2006(その全体が参照により本明細書に援用される)には、薬学的組成物の製剤化に使用される様々な賦形剤およびそれらの調製のための既知の技術が開示されている。ヌクレアーゼを含む薬学的組成物を製造するためのさらなる好適な方法、試薬、賦形剤、および溶媒については、PCT出願第PCT/US2010/055131号(公開番号第WO2011/053982A8号、2010年11月2日出願)も参照されたい(その全体が、参照により本明細書に援用される)。
任意の従来の賦形剤媒体が、任意の望ましくない生物学的作用を生み出すことによって、またはその他、薬学的組成物の任意の他の成分と有害な様式で相互作用することによって、物質またはその誘導体と適合しない場合を除いて、その使用は、本開示の範囲内であることとが企図される。
組成物は、上に記載のように、有効量で投与され得る。有効量は、投与様式、治療される特定の状態、および所望の転帰に依存する。これはまた、状態のステージ、対象の年齢および身体状態、同時療法の性質(もしあれば)、ならびに医師に周知の同様の要因に依存し得る。それは、治療用途において、医学的に望ましい結果を達成するのに十分な量である。
一部の実施形態では、本開示による組成物は、様々な疾患、障害、および/または状態のうちのいずれかの治療に使用することができる。
治療方法
本発明の一部の態様は、治療を必要とする対象を治療する方法を提供し、本方法は、それを必要とする対象に、有効量の本明細書に記載の薬学的組成物を投与することを含む。より具体的には、治療方法は、それを必要とする対象に、キメラ受容体(CAR)を発現する修飾免疫細胞の集団を含み、かつ少なくとも1つの編集された遺伝子を有する1つ以上の薬学的組成物を投与することを含み、少なくとも1つの編集された遺伝子は、フラトリサイド耐性を提供し、修飾免疫細胞の機能を増強するか、または免疫抑制もしくは免疫阻害を低減し、少なくとも1つの編集された遺伝子の発現は、ノックアウトまたはノックダウンされる。一部の実施形態では、治療方法は、自己免疫細胞療法である。他の実施形態では、治療方法は、同種免疫細胞療法である。
特定の実施形態では、免疫細胞の特異性は、本明細書で企図されるキメラ抗原受容体を発現するように免疫細胞を遺伝子修飾することによって、対象における疾患細胞または改変細胞の表面上に発現されたマーカーに再誘導される。一部の実施形態では、治療方法は、対象に、本明細書に記載の免疫細胞を投与することを含み、免疫細胞は、腫瘍細胞上で発現されたマーカーにその特異性を再誘導するように遺伝子修飾されている。一部の実施形態では、腫瘍は、B細胞がん、例えば、B細胞がん(リンパ腫、白血病、または骨髄腫(例えば、多発性骨髄腫)など)である。一部の実施形態では、腫瘍は、固形腫瘍である。他の実施形態では、腫瘍は、液体腫瘍である。一部の実施形態では、腫瘍は、血液がんである。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。場合によっては、白血病は、前白血病を含む。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。
腫瘍の非限定的な例としては、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫が挙げられる。一部の実施形態では、腫瘍は、T細胞急性リンパ芽球性白血病(T-ALL)である。一部の実施形態では、腫瘍は、急性骨髄性白血病(AML)である。したがって、本開示の一部の実施形態は、対象における腫瘍の治療方法を提供する。
一部の実施形態では、治療方法は、腫瘍(例えば、白血病)を有するか、または腫瘍を発症する傾向がある対象に、機能的T細胞受容体α定常領域(TRAC)、表面抗原分類33(CD33)、表面抗原分類3(CD3)、表面抗原分類5(CD5)、表面抗原分類7(CD7)、表面抗原分類52(CD52)、表面抗原分類123(CD123)、プログラム細胞死1(PD-1)、β2マイクログロブリン(B2M)、FAS細胞表面細胞死受容体(FAS)、リンパ球活性化遺伝子3(LAG-3)、クラスII主要組織適合複合体、トランスアクチベーター(CIITA)、T細胞受容体β定常領域1(TRBC1)、T細胞受容体β定常領域2(TRBC2)、もしくはそれらの組み合わせを欠いているか、または減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)を投与することを含む。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象は、CD123を欠くかまたはそのレベルが減少し、かつCD123キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象は、CD5を欠くかまたはそのレベルが減少し、かつCD5キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象は、CD7を欠くかまたはそのレベルが減少し、かつCD7キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象は、CD33を欠くかまたはそのレベルが減少し、かつCD33キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象は、CD3を欠くかまたはそのレベルが減少し、かつCD3キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。
一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的TRACを欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的B2Mを欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的FASを欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的LAG-3を欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的TRBC1および/またはTRBC2を欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、機能的CIITAを欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、CD52を欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、PD-1を欠くかまたは減少したレベルを有する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。
一部の実施形態では、腫瘍(例えば、白血病)を有するか、または発症する傾向がある対象に、CD123を欠くかまたは減少したレベルを有し、かつTRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、および/もしくはPD-1またはそれらの組み合わせを欠くかまたは減少したレベルを有し、かつ含まれるCD123キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)またはその集団が投与される。一部の実施形態では、腫瘍(例えば、白血病)を有するか、または発症する傾向がある対象に、CD5を欠くかまたは減少したレベルを有し、かつTRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、および/もしくはPD-1、またはそれらの組み合わせを欠くかまたは減少したレベルを有し、かつCD5キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、白血病)を有するか、または発症する傾向がある対象に、CD7を欠くかまたは減少したレベルを有し、かつTRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、および/もしくはPD-1、またはそれらの組み合わせを欠くかまたは減少したレベルを有し、かつCD7キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、白血病)を有するか、または発症する傾向がある対象に、CD33を欠くかまたは減少したレベルを有し、かつTRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、および/もしくはPD-1、またはそれらの組み合わせを欠くかまたは減少したレベルを有し、かつCD33キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。一部の実施形態では、腫瘍(例えば、白血病)を有するか、または発症する傾向がある対象に、CD3を欠くかまたは減少したレベルを有し、かつTRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、および/もしくはPD-1、またはそれらの組み合わせを欠くかまたは減少したレベルを有し、かつCD3キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)が投与される。
対象において腫瘍を治療する方法の一部の実施形態では、対象に、本明細書に記載の免疫細胞と1つ以上の追加の治療剤とを投与することを含む。例えば、本発明の免疫細胞は、1つ以上の追加の修飾免疫細胞またはその集団と同時投与され得る。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、CD123を欠くかまたは減少したレベルを有し、かつCD123キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、CD33を欠くかまたは減少したレベルを有し、かつCD33キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、が同時投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、CD5を欠くかまたは減少したレベルを有し、かつCD5キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、CD7を欠くかまたは減少したレベルを有し、かつCD7キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、が同時投与される。一部の実施形態では、免疫細胞のうちのいずれかは、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、および/もしくはPD1、またはそれらの組み合わせのうちの1つ以上における変異をさらに含む。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、CD3を欠くかまたは減少したレベルを有し、かつCD3キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、CD7を欠くかまたは減少したレベルを有し、かつCD7キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、が同時投与される。一部の実施形態では、腫瘍(例えば、T細胞またはNK細胞悪性腫瘍)を有するか、または発症する傾向がある対象に、CD3を欠くかまたは減少したレベルを有し、かつCD3キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、CD123を欠くかまたは減少したレベルを有し、かつCD123キメラ抗原受容体を発現する、有効量の修飾免疫エフェクター細胞(例えば、CAR-T細胞)と、が同時投与される。
一部の実施形態では、本発明の免疫細胞は、サイトカインと同時投与され得る。一部の実施形態では、サイトカインは、IL-2、IFN-α、IFN-γ、またはそれらの組み合わせである。一部の実施形態では、免疫細胞は、化学療法剤と同時投与される。化学療法剤は、シクロホスファミド、ドキソルビシン、ビンクリスチン、プレドニゾン、またはリツキシマブ、またはそれらの組み合わせであり得る。他の化学療法剤としては、オビヌツズマブ、ベンダムスチン、クロラムブシル、シクロホスファミド、イブルチニブ、メトトレキサート、シタラビン、デキサメタゾン、シスプラチン、ボルテゾミブ、フルダラビン、イデラリシブ、アカラブルチニブ、レナリドミド、ベネトクラクス、シクロホスファミド、イホスファミド、エトポシド、ペントスタチン、メルファラン、カルフィルゾミブ、イキサゾミブ、パノビノスタット、ダラツムマブ、エロツズマブ、サリドマイド、レナリドミド、またはポマリドミド、またはそれらの組み合わせが挙げられる。「同時投与」は、治療の過程で、2つ以上の治療剤または薬学的組成物を投与することを指す。かかる同時投与は、同時投与または逐次投与であり得る。後で投与される治療剤または薬学的組成物の逐次投与は、第1の薬学的組成物または治療剤の投与後、治療過程の任意の時点で行われ得る。
本発明の一部の実施形態では、投与された免疫細胞は、インビボで増殖し、対象において長期間残留することができる。本発明の免疫細胞は、一部の実施形態では、メモリー免疫細胞に成熟し、対象内の循環に残留することができ、それによって、キメラ抗原受容体によって認識されるマーカーを発現する疾患細胞または改変細胞の再発に能動的に応答することができる細胞の集団を生成する。
免疫細胞に核酸塩基エディターポリペプチドを発現または導入し、細胞を少なくとも1つのポリペプチドをコードする核酸分子を標的とすることができる2つ以上のガイドRNAと接触させる方法によって産生された修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が本明細書に提供され、第1のポリペプチドは、Cblがん原遺伝子B(CBLB)であり、第2のポリペプチドは、T細胞受容体α定常領域(TRAC)、β2マイクログロブリン(B2M)、およびプログラム細胞死タンパク質1(PD1)ポリペプチドからなる群から選択され、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)とシチジンデアミナーゼとを含む。かかる方法の一例では、3つのガイドRNAが、細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、またはCBLBポリヌクレオチドを標的とする。かかる方法の別の例では、4つのガイドRNAが、細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、およびCBLBポリヌクレオチドのうちの1つを標的とする。一例では、2つのガイドRNAが、細胞で発現されるか、または接触され、各々、B2MまたはTRACポリヌクレオチドを標的とする。別の例では、3つのガイドRNAが細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、またはCBLBポリヌクレオチドを標的とする。別の例では、4つのガイドRNAが、細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、およびCBLBポリヌクレオチドのうちの1つを標的とする。別の例では、3つのガイドRNAが、細胞で発現されるか、または接触され、各々、B2M、TRAC、およびPDCD1ポリヌクレオチドを標的とする。別の例では、ガイドRNAは、TRACエキソン4スプライスアクセプター部位、B2Mエキソン1スプライスドナー部位、またはPDCD1エキソン1スプライスドナー部位を標的とする。別の実施形態では、修飾免疫細胞を産生する方法は、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)ポリヌクレオチドを標的とするガイドRNAを、細胞で発現させることをさらに含む。
免疫細胞に核酸塩基エディターポリペプチドを発現または導入し、細胞を、Cblがん原遺伝子B(CBLB)、T細胞受容体α定常領域(TRAC)、β2マイクログロブリン(B2M)、およびプログラム細胞死タンパク質1(PD1)ポリペプチドからなる群から選択される少なくとも1つのポリペプチドをコードする核酸分子を標的とすることができる2つ以上のガイドRNAと接触させる方法によって産生された修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が本明細書に提供され、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)とアデノシンデアミナーゼとを含む。一例では、2つのガイドRNAが、細胞で発現されるか、または接触され、各々、B2MまたはTRACポリヌクレオチドを標的とする。別の例では、3つのガイドRNAが細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、またはCBLBポリヌクレオチドを標的とする。別の例では、4つのガイドRNAが、細胞で発現されるか、または細胞と接触され、各々、B2M、TRAC、PDCD1、およびCBLBポリヌクレオチドのうちの1つを標的とする。別の例では、3つのガイドRNAが、細胞で発現されるか、または接触され、各々、B2M、TRAC、およびPDCD1ポリヌクレオチドを標的とする。別の例では、ガイドRNAは、TRACエキソン4スプライスアクセプター部位、B2Mエキソン1スプライスドナー部位、またはPDCD1エキソン1スプライスドナー部位を標的とする。別の実施形態では、修飾免疫細胞を産生する方法は、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)ポリヌクレオチドを標的とするガイドRNAを、細胞で発現させることをさらに含む。
免疫細胞に核酸塩基エディターポリペプチドを発現または導入し、細胞を、Vセット免疫調節受容体(VISTA)、T細胞免疫グロブリンムチン3(Tim-3)、IgおよびITIMドメインを有するT細胞免疫受容体(TIGIT)、形質転換成長因子β受容体II(TGFbRII)、調節因子X関連アンキリン含有タンパク質(RFXANK)、PVR関連免疫グロブリンドメイン含有(PVRIG)、リンパ球活性化遺伝子3(Lag3)、細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)、キチナーゼ3様1(Chi3l1)、表面抗原分類96(CD96)、Bリンパ球およびTリンパ球関連(BTLA)、Tetメチルシトシンジオキシゲナーゼ2(TET2)、Sprouty RTKシグナル伝達アンタゴニスト1(Spry1)、Sprouty RTKシグナル伝達アンタゴニスト2(Spry2)、クラスII主要組織適合複合体トランスアクチベーター(CIITA)、表面抗原分類3(CD3)、表面抗原分類7(CD7)、表面抗原分類33(CD33)、表面抗原分類52(CD52)、表面抗原分類123(CD123)、T細胞受容体β定常領域1(TRBC1)、T細胞受容体β定常領域2(TRBC2)、サイトカイン誘導性SH2含有タンパク質(CISH)、アセチルCoAアセチルトランスフェラーゼ1(ACAT1)、シトクロムP450ファミリー11サブファミリーAメンバー1(Cyp11a1)、GATA結合タンパク質3(GATA3)、核受容体サブファミリー4グループAメンバー1(NR4A1)、核受容体サブファミリー4グループAメンバー2(NR4A2)、核受容体サブファミリー4グループAメンバー3(NR4A3)、メチル化調節Jタンパク質(MCJ)、Fas細胞表面細胞死受容体(FAS)、およびセレクチンPリガンド/P-セレクチン糖タンパク質リガンド1(SELPG/PSGL1)ポリペプチドからなる群から選択される少なくとも1つのポリペプチドをコードする核酸分子を標的とすることができる2つ以上のガイドRNAと接触させる方法によって産生された修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が本明細書に提供され、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)とアデノシンデアミナーゼもしくはシチジンデアミナーゼとを含む。一実施形態では、細胞を産生する方法は、細胞を、T細胞受容体α定常領域(TRAC)、β2マイクログロブリン(B2M)、およびプログラム細胞死タンパク質1(PD1)ポリペプチドからなる群から選択される少なくとも1つのポリペプチドをコードする核酸分子を標的化することができる2つ以上のガイドRNAと接触させることをさらに含む。別の実施形態では、修飾免疫細胞を産生する方法は、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)ポリヌクレオチドを標的とするガイドRNAを、細胞で発現させることをさらに含む。
本明細書では、腫瘍を有する対象から単離された免疫細胞において、CBLB、PD1、CTLA4、TGFBR2、TIGIT、またはマイナー組織適合ポリペプチドからなる群から選択されるポリペプチドをコードするポリヌクレオチドを標的とする1つ以上のガイドRNAと、核酸DNAプログラマブル結合タンパク質(napDNAbp)とシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む核酸塩基エディターポリペプチドと、を発現させることを含む方法によって産生された抗腫瘍活性を有する、修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、本明細書に記載される腫瘍または液体がんを治療する方法が本明細書に提供される。一例では、ガイドRNAは、各々、CBLBおよびPDCD1ポリヌクレオチドを標的とする。一例では、ガイドRNAは、各々、PDCD1およびCTLA4ポリヌクレオチドを標的とする。一例では、ガイドRNAは、各々、CBLB、PDCD1、およびCTLA4ポリヌクレオチドを標的とする。一例では、ガイドRNAは、各々、CBLB、PD1、およびCTLA4ポリヌクレオチドを標的とする。
上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、ガイドRNAは、標的ポリヌクレオチドのスプライスアクセプター部位またはスプライスドナー部位を標的とする。上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、核酸塩基エディターポリペプチドは、標的ポリヌクレオチドにおいて終止コドンを生成する。上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、核酸塩基エディターポリペプチドは、PDCD1エキソン2において終止コドンを生成する。上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、核酸塩基エディターポリペプチドが、例えば、二分NLS、N末端NLS、C末端NLS、または1つ以上のウラシルグリコシラーゼ阻害因子などの1つ以上の核局在化シグナル(NLS)を発現することをさらに含む。
上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、napDNAbpは、Cas9、CasX、CasY、Cpfl、Cas12b/C2c1、Cas12c/C2c3、Cas12j/CasΦ、およびBvCas12b、またはそれらの活性断片からなる群から選択される。上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、napDNAbpドメインは、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9を含む。上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、シチジンデアミナーゼは、Petromyzon marinusシトシンデアミナーゼ1(pmCDA1)、または活性化誘導シチジンデアミナーゼ(AICDA)であり、アデノシンデアミナーゼは、TadAである。
上に記載される修飾免疫細胞を産生するかかる方法のいずれかにおいて、一例では、本方法は、TIGITポリヌクレオチド、TGFBR2ポリヌクレオチド、ZAP70ポリヌクレオチド、NFATc1ポリヌクレオチド、およびTET2ポリヌクレオチドを標的とする1つ以上のガイドRNAを、免疫細胞で発現することをさらに含む。
場合によっては、対象に投与される修飾免疫細胞は、検出可能な転座を含まないことが理解される。
本明細書では、免疫原性が低下し、抗腫瘍活性が増加した修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が提供され、修飾免疫細胞は、TRAC、B2M、CBLB、もしくはPD1ポリヌクレオチド、またはそれらの組み合わせにおける変異を含む。一例では、修飾免疫細胞は、B2MおよびTRACポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、B2M、TRAC、およびPDCD1ポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、B2M、TRAC、およびCBLBポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、B2M、TRAC、CBLB、およびPD1ポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、TIGIT、TGFBR2、ZAP70、NFATc1、またはTET2をコードする1つ以上のポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、Vセット免疫調節受容体(VISTA)、T細胞免疫グロブリンムチン3(Tim-3)、IgおよびITIMドメインを有するT細胞免疫受容体(TIGIT)、形質転換成長因子β受容体II(TGFbRII)、調節因子X関連アンキリン含有タンパク質(RFXANK)、PVR関連免疫グロブリンドメイン含有(PVRIG)、リンパ球活性化遺伝子3(Lag3)、細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)、キチナーゼ3様1(Chi3l1)、表面抗原分類96(CD96)、Bリンパ球およびTリンパ球関連(BTLA)、Tetメチルシトシンジオキシゲナーゼ2(TET2)、Sprouty RTKシグナル伝達アンタゴニスト1(Spry1)、Sprouty RTKシグナル伝達アンタゴニスト2(Spry2)、クラスII主要組織適合複合体トランスアクチベーター(CIITA)、表面抗原分類3(CD3)、表面抗原分類7(CD7)、表面抗原分類33(CD33)、表面抗原分類52(CD52)、表面抗原分類123(CD123)、T細胞受容体β定常領域1(TRBC1)、T細胞受容体β定常領域2(TRBC2)、サイトカイン誘導性SH2含有タンパク質(CISH)、アセチルCoAアセチルトランスフェラーゼ1(ACAT1)、シトクロムP450ファミリー11サブファミリーAメンバー1(Cyp11a1)、GATA結合タンパク質3(GATA3)、核受容体サブファミリー4グループAメンバー1(NR4A1)、核受容体サブファミリー4グループAメンバー2(NR4A2)、核受容体サブファミリー4グループAメンバー3(NR4A3)、メチル化調節Jタンパク質(MCJ)、Fas細胞表面細胞死受容体(FAS)、およびセレクチンPリガンド/P-セレクチン糖タンパク質リガンド1(SELPG/PSGL1)をコードする1つ以上のポリヌクレオチドにおける変異を含む。別の例では、修飾免疫細胞は、例えば、腫瘍に関連するマーカー(例えば、B細胞成熟抗原(BCMA))に対する親和性を有する細胞外ドメインを含む、キメラ抗原受容体を発現する。
本明細書では、免疫原性が低下し、抗腫瘍活性が増加した修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が提供され、修飾免疫細胞は、CD33、PD-1、CD52、TRACポリヌクレオチドのうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD33、PD-1、CD52、TRAC、またはそれらの組み合わせのうちの2つ以上の変異を含む。様々な実施形態では、修飾免疫細胞は、CD33、PD-1、CD52、TRAC、またはそれらの組み合わせのうちの3つ以上の変異を含む。一例では、修飾免疫細胞は、CD33、PD-1、CD52、およびTRACにおける変異を含む。
本明細書では、免疫原性が低下し、抗腫瘍活性が増加した修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が提供され、修飾免疫細胞は、CD3、PD-1、CD52、TRAC、CD7ポリヌクレオチドのうちの1つ以上、またはそれらの組み合わせにおける変異を含む。様々な実施形態では、修飾免疫細胞は、CD3、PD-1、CD52、TRAC、CD7、またはそれらの組み合わせのうちの2つ以上の変異を含む。一例では、修飾免疫細胞は、CD3およびCD7における変異を含む。様々な実施形態では、修飾免疫細胞は、CD3、PD-1、CD52、TRAC、CD7、またはそれらの組み合わせのうちの3つ以上の変異を含む。一例では、修飾免疫細胞は、CD3、PD-1、CD52、TRAC、およびCD7における変異を含む。
本明細書では、免疫細胞に核酸塩基エディターポリペプチドと、β2マイクログロブリン(B2M)およびプログラム細胞死タンパク質1(PD1)ポリペプチドからなる群から選択される少なくとも1つのポリペプチドをコードする核酸分子を標的とすることができる2つ以上のガイドRNAと、Cas12ポリペプチドと、TRACをコードする核酸分子を標的とすることができるガイドRNAと、キメラ抗原受容体(CAR)またはT細胞受容体をコードするDNAドナー鋳型と、を発現または導入する方法によって産生された修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が提供され、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)およびシチジンデアミナーゼを含む。
本明細書では、免疫原性が低下し、抗腫瘍活性が増加した修飾免疫細胞(例えば、健常な対象から得られた免疫細胞、または、例えば、細胞傷害性T細胞、制御性T細胞、またはTヘルパー細胞などのT細胞)を用いて、腫瘍または液体がんを治療する方法が提供され、修飾免疫細胞は、B2MまたはPD1ポリヌクレオチドのうちの1つ以上における変異、TRAC遺伝子座におけるキメラ抗原受容体(CAR)をコードする核酸の挿入、ならびに免疫細胞の細胞表面でのCARの発現を含む。
本発明の一部の実施形態では、治療を必要とする対象において液体がんを治療する方法が本明細書に提供され、必要とする対象に、治療有効量の本明細書に記載される薬学的組成物を投与することを含む。かかる方法によって治療される液体がんには、リンパ腫、白血病、骨髄腫、またはそれらの組み合わせが含まれるが、これらに限定されない。
一例では、治療を必要とする対象において液体がんを治療する方法が本明細書に提供され、必要とする対象に、治療有効量の本明細書に記載される薬学的組成物を投与することを含み、液体がんは、リンパ腫を含む。本明細書に記載の方法を使用して治療される液体リンパ腫としては、これらに限定されないが、悪性形質細胞腫瘍、ホジキンリンパ腫、結節性リンパ球優位性ホジキンリンパ腫、真性多血症、ホジキンリンパ腫、小リンパ球性リンパ腫(SLL)、びまん性大細胞型B細胞リンパ腫、免疫芽球性大細胞型リンパ腫、前駆Bリンパ芽球性リンパ腫、マントル細胞リンパ腫、辺縁帯リンパ腫、菌状息肉症、未分化大細胞リンパ腫、セザリー症候群、前駆Tリンパ芽球性リンパ腫、およびびまん性大細胞型B細胞リンパ腫と古典的ホジキンリンパ腫の中間の特徴を有する未分類のB細胞リンパ腫、B細胞非ホジキンリンパ腫(NHL)、濾胞性リンパ腫、バーキットリンパ腫、バーキット様リンパ腫、辺縁帯リンパ腫、マントル細胞リンパ腫、びまん性大細胞型B細胞リンパ腫(DLBCL)、原発性縦隔B細胞リンパ腫、大細胞リンパ腫、前駆Bリンパ芽球性リンパ腫、びまん性大細胞型B細胞リンパ腫とバーキットリンパ腫の中間の特徴を有する未分類のB細胞リンパ腫、辺縁帯リンパ腫、粘膜関連リンパ組織リンパ腫、小細胞型リンパ球性リンパ腫、マントル細胞リンパ腫、原発性縦隔(胸腺)大細胞型B細胞リンパ腫、リンパ形質細胞性リンパ腫(ワルデンストレームマクログロブリン血症など)、節性濾胞辺縁帯B細胞リンパ腫、脾辺縁帯リンパ腫、血管内大細胞型B細胞リンパ腫、原発性滲出液リンパ腫、リンパ腫様肉芽腫症、T細胞/組織球豊富型大細胞型B細胞リンパ腫、原発性中枢神経系リンパ腫、原発性皮膚びまん性大細胞型B細胞リンパ腫(下肢型)、高齢者EBV陽性びまん性大細胞型B細胞リンパ腫、炎症を伴うびまん性大細胞型B細胞リンパ腫、血管内大細胞型B細胞リンパ腫、ALK陽性大細胞型B細胞リンパ腫、形質芽球性リンパ腫、HHV8関連多中心性キャッスルマン病で発生する大細胞型B細胞リンパ腫、縦隔(胸腺)大細胞型B細胞リンパ腫、血管内大細胞型B細胞リンパ腫、原発性滲出性リンパ腫(鼻型)、腸症型T細胞リンパ腫、肝脾T細胞リンパ腫、芽球性NK細胞リンパ腫、原発性皮膚未分化大細胞リンパ腫、リンパ腫様丘疹症、血管免疫芽球性T細胞リンパ腫、末梢性T細胞リンパ腫、不特定未分化大細胞リンパ腫、古典的ホジキンリンパ腫(結節硬化型、混合細胞型、リンパ球豊富型、リンパ球減少型、またはリンパ球非減少型)、結節性リンパ球優位型ホジキンリンパ腫、成人T細胞リンパ腫、B細胞リンパ腫-DLBCL、B細胞リンパ腫-DLBCL-胚中心様、B細胞リンパ腫-DLBCL活性化B細胞様、非ホジキンリンパ腫、原発性中枢神経系(CNS)リンパ腫、T細胞リンパ腫、末梢T細胞リンパ腫、皮膚T細胞リンパ腫(CTCL)、未分化大細胞リンパ腫(ALCL)、AIDS関連リンパ腫、腸管症型T細胞リンパ腫、肝脾T細胞リンパ腫、芽球性NK細胞リンパ腫、原発性皮膚未分化大細胞リンパ腫、リンパ腫様丘疹症、血管免疫芽球性T細胞リンパ腫、末梢T細胞リンパ腫、不特定未分化大細胞リンパ腫、古典的ホジキンリンパ腫(結節硬化型、混合細胞型、リンパ球豊富型、リンパ球減少型、またはリンパ球非減少型)、結節性リンパ球優位型ホジキンリンパ腫、その他のリンパ腫、ならびにそのようなリンパ腫の組み合わせが挙げられる。
一例では、治療を必要とする対象において液体がんを治療する方法が本明細書に提供され、必要とする対象に、治療有効量の本明細書に記載される薬学的組成物を投与することを含み、液体がんは、白血病を含む。場合によっては、白血病は、前白血病を含む。前白血病として、例えば、骨髄異形成症候群(MDS)が挙げられる。場合によっては、白血病は、急性白血病である。急性白血病としては、例えば、急性骨髄性白血病(AML)が挙げられる。急性白血病には、例えば、急性リンパ性白血病または急性リンパ球性白血病(ALL)も含まれ、ALLには、B系統ALL、T系統ALL、およびT細胞急性リンパ球性白血病(T-ALL)が含まれる。本明細書に記載の方法で治療される他の白血病としては、これらに限定されないが、有毛細胞白血病(HCL)、慢性骨髄性白血病(CIVIL)、慢性骨髄単球性白血病(CMML)、慢性リンパ球性白血病(CLL)、B細胞前リンパ球性白血病、骨髄性白血病、バーキット白血病、T細胞前リンパ球性白血病、T細胞大顆粒リンパ球性白血病、アグレッシブナチュラルキラー(NK)細胞白血病、成人T細胞白血病(ATL)、急性前骨髄性白血病(APML)、前リンパ球性白血病(PLL)、赤芽球性白血病、急性巨核芽球性白血病、大顆粒リンパ球性白血病(LGF)、慢性骨髄性白血病(CML)、他の白血病、およびそのような白血病の組み合わせが挙げられる。
一例では、治療を必要とする対象において液体がんを治療する方法が本明細書に提供され、必要とする対象に、治療有効量の本明細書に記載される薬学的組成物を投与することを含み、液体がんは、骨髄腫を含む。本明細書に記載の方法を使用して治療される骨髄腫としては、これらに限定されないが、多発性骨髄腫、くすぶり型多発性骨髄腫、形質細胞骨髄腫、非分泌型骨髄腫、IgD骨髄腫、骨硬化性骨髄腫、他の骨髄腫、およびそのような骨髄腫の組み合わせが挙げられる。
一例では、治療を必要とする対象において液体がんを治療する方法が本明細書に提供され、必要とする対象に、治療有効量の本明細書に記載される薬学的組成物を投与することを含み、液体がんは、カーラー病、骨髄腫症、形質細胞腫、骨の弧立性形質細胞腫、髄外形質細胞腫菌状息肉症/セザリー症候群、原発性皮膚CD30陽性T細胞リンパ増殖性障害、好酸球増加症、慢性好酸球増加症、および他の造血細胞関連がんを含む。
一実施形態では、対象は、少なくとも0.1×10個の細胞、少なくとも0.5×10個の細胞、少なくとも1×10個の細胞、少なくとも5×10個の細胞、少なくとも1×10個の細胞、少なくとも0.5×10個の細胞、少なくとも1×10個の細胞、少なくとも0.5×10個の細胞、少なくとも1×10個の細胞、少なくとも0.5×10個の細胞、少なくとも1×10個の細胞、少なくとも2×10個の細胞、少なくとも3×10個の細胞、少なくとも4×10個の細胞、少なくとも5×10個の細胞、または少なくとも1×1010個の細胞が投与される。特定の実施形態では、約1×10個の細胞~約1×10個の細胞、約2×10個の細胞~約0.9×10個の細胞、約3×10個の細胞~約0.8×10個の細胞、約4×10個の細胞~約0.7×10個の細胞、約5×10個の細胞~約0.6×10個の細胞、または約5×10個の細胞~約0.5×10個の細胞が対象に投与される。
一実施形態では、対象は、少なくとも0.1×10細胞/kg体重、少なくとも0.5×10細胞/kg体重、少なくとも1×10細胞/kg体重、少なくとも5×10細胞/kg体重、少なくとも1×10細胞/kg体重、少なくとも0.5×10細胞/kg体重、少なくとも1×10細胞/kg体重、少なくとも0.5×10細胞/kg体重、少なくとも1×10細胞/kg体重、少なくとも0.5×10細胞/kg体重、少なくとも1×10細胞/kg体重、少なくとも2×10細胞/kg体重、少なくとも3×10細胞/kg体重、少なくとも4×10細胞/kg体重、少なくとも5×10細胞/kg体重、または少なくとも1×10細胞/kg体重が投与される。特定の実施形態では、約1×10細胞/kg体重~約1×10細胞/kg体重、約2×10T細胞/kg体重~約0.9×10細胞/kg体重、約3×10細胞/kg体重~約0.8×10細胞/kg体重、約4×10細胞/kg体重~約0.7×10細胞/kg体重、約5×10細胞/kg体重~約0.6×10細胞/kg体重、または約5×10細胞/kg体重~約0.5×10細胞/kg体重が対象に投与される。
特定の実施形態で企図される薬学的組成物の複数回投与が、所望の療法に影響を及ぼすために必要とされ得ることを、当業者は理解するであろう。例えば、組成物は、対象に、1週間、2週間、3週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、1年、2年、5年、10年、またはそれ以上の期間にわたって、1、2、3、4、5、6、7、8、9、もしくは10回、またはそれ以上投与され得る。かかる方法のいずれかにおいて、本方法は、対象に、有効量の修飾免疫細胞を投与することを含み得、本方法は、免疫応答を増加または減少させる。かかる方法のいずれかにおいて、本方法は、1日当たり1用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1日当たり2用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1日当たり3用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1週間当たり1用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1週間当たり2用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1週間当たり3用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1ヶ月当たり1用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1ヶ月当たり2用量以上の有効量の修飾免疫細胞を投与することを含み得る。かかる方法のいずれかにおいて、本方法は、1ヶ月当たり3用量以上の有効量の修飾免疫細胞を投与することを含み得る。
特定の実施形態では、活性化された薬学的組成物を対象に投与し、次いで、再採血し(または、アフェレーシスを実施し)、そこからT細胞を活性化し、これらの活性化および増殖されたT細胞を患者に再注入することが望ましい場合がある。このプロセスは、数週間ごとに複数回実施され得る。特定の実施形態では、T細胞は、10cc~400ccの採血から活性化され得る。特定の実施形態では、T細胞は、20cc、30cc、40cc、50cc、60cc、70cc、80cc、90cc、100cc、150cc、200cc、250cc、300cc、350cc、もしくは400cc、またはそれ以上の採血から活性化される。
本明細書で企図される薬学的組成物の投与は、これらに限定されないが、注入、輸液、または非経口を含む従来の技術を使用して実施され得る。一部の実施形態では、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、くも膜下、および胸骨内に注入または注射を含む。
個々の対象における奏効(response)は、完全奏効、部分奏効、安定した疾患、および進行性疾患として特徴付けることができる。一部の実施形態では、奏効は、完全奏効(CR)である。完全奏効は、すべての循環腫瘍細胞(CTC)または単核血球(MNBC)の消失(すなわち、任意の病理学的リンパ節(標的または非標的を問わない)は、短軸が10mm未満に減少しなければならない)として定義することができる。一部の実施例では(例えば、AML)、完全奏効は、以下として定義することができる:骨髄芽球<5%、アウエル小体を含む芽球の不在、髄外疾患の不在、絶対好中球数>1.0×10/L(1000/μL)、血小板数>100×10/L(100000/μL)、および赤血球輸血非依存性。特定の実施形態では、奏効は、不完全回復(CRi)を有するCRである。一部の例では(例えば、AML)、不完全回復を有するCRは、残存好中球減少症(<1.0×10/L[1000/μL])または血小板減少症(<100×10/L[100000/μL])を除くすべてのCR基準を含むように定義することができる。特定の実施形態では、奏効は、形態学的な白血病のない状態である。一部の実施例(例えば、AML)では、形態学的な白血病のない状態は、骨髄芽球<5%、アウエル小体を含む芽球の不在、髄外疾患の不在、および血液学的な回復の不要を含むように定義することができる。特定の実施形態では、奏効は、部分奏効(PR)である。部分奏効は、ベースラインの径和(sum diameter)を基準として、循環腫瘍細胞(CTC)または単核血球(MNBC)の径和の少なくとも30%の減少を意味するように定義することができる。一部の実施例(例えば、AML)では、部分奏効は、CRのすべての血液学的基準:5%~25%への骨髄芽球の割合の減少、および少なくとも50%の処置前の骨髄芽球の割合の減少を含むように定義され得る。特定の実施形態では、奏効は、形態学的な白血病のない状態である。一部の実施例(例えば、AML)では、形態学的な白血病のない状態は、骨髄芽球<5%、アウエル小体を含む芽球の不在、髄外疾患の不在、および血液学的な回復の不要を含むように定義することができる。特定の実施形態では、奏効は、再発である。
一部の実施例(例えば、AML)では、再発は、骨髄芽球<5%、アウエル小体を含む芽球の不在、髄外疾患の不在、および血液学的回復の不要を含むように定義することができる。一部の実施形態では、奏効は、進行性疾患(PD)である。進行性疾患は、試験での最小の数(これには、ベースラインの数が最小である場合が含まれる)と、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、もしくは少なくとも100、またはそれ以上の循環腫瘍細胞(CTC)または単核血球(MNBC)の絶対的な増加とを基準として、循環腫瘍細胞(CTC)または単核血球(MNBC)の数の少なくとも20%の増加として定義することができる。
1つ以上の新しい病変の出現も、進行とみなすことができる。一部の実施形態では、疾患は、安定した疾患(SD)であり得る。安定した疾患は、試験での最小の数のCTCおよび/またはMNBCを基準として、PRに適格な液体がん細胞数の十分な減少も、PDに適格な十分な増加も特徴付けることができない。特定の実施形態では、奏効は、病理学的な完全奏効である。病理学的な完全奏効は、例えば、手術または生検時に取り出された組織の検査後に病理学者によって決定されるように、概して、外科標本中の侵襲性および/または非侵襲性液体がん細胞の組織学的証拠の不在を指す。
一部の実施形態では、薬学的組成物は、週に2回または3回投与される。別の実施形態では、薬学的組成物は、週に2回投与される。別の実施形態では、薬学的組成物は、2週間または3週間に1回投与される。別の実施形態では、薬学的組成物は、1週間または2週間に1回投与される。別の実施形態では、薬学的組成物は、21日サイクルの1日目、4日目、8日目、および11日目に投与される。別の実施形態では、薬学的組成物は、28日サイクルの1日目、8日目、および15日目に投与される。
一部の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約0.5~30mgである。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約0.5~20mgである。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約0.5~10mgである。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約0.04mg、約0.08mg、約0.16mg、約0.32mg、約0.64mg、約1.25mg、約1.28mg、約1.92mg、約2.5mg、約3.56mg、約3.75mg、約5.0mg、約7.12mg、約7.5mg、約10mg、約14.24mg、約15mg、約20mg、または約30mgである。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mg、または約30.0mgであり、化合物は、週に2回投与される。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mg、または約20mgであり、化合物は、週に2回投与される。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mg、または約30.0mgであり、化合物は、週に1回投与される。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mg、または約20mgであり、化合物は、週に1回投与される。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mg、または約30.0mgであり、化合物は、1日に1回、7日間に3回、5回、または7回投与される。別の実施形態では、化合物は、1日に1回、7日間の期間に7回静脈内投与される。別の実施形態では、投与される化合物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mg、または約20mgであり、化合物は、1日に1回、7日間に3回、5回、または7回投与される。別の実施形態では、化合物は、1日に1回、7日間の期間に7回静脈内投与される。
一部の実施形態では、化合物は、0.25時間、0.5時間、1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間、または12時間の期間にわたって投与される。別の実施形態では、化合物は、0.25~2時間の期間にわたって投与される。別の実施形態では、化合物は、1時間の期間にわたって徐々に投与される。別の実施形態では、化合物は、2時間の期間にわたって徐々に投与される。
一部の実施形態では、化合物のインビボ循環半減期は、約1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、または12時間である。別の実施形態では、化合物のインビボ循環半減期は、約4時間である。別の実施形態では、化合物のインビボ循環半減期は、約6時間である。一部の実施形態では、化合物の生体組織半減期は、約1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、または12時間である。別の実施形態では、化合物の生体組織半減期は、約10時間である。
一部の実施形態では、治療は、治療開始後1ヶ月の期間内に、液体がん細胞の数の約95%、約90%、約85%、約80%、約75%、約70%、約65%、約60%、約55%、約50%、約45%、約40%、約35%、約30%、約25%、約20%、約15%、約10%、または約5%の減少をもたらす。別の実施形態では、治療は、治療開始後1ヶ月の期間内に、液体がん細胞の数の少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%の減少をもたらす。別の実施形態では、治療は、治療開始後1年の期間内に、液体がん細胞の数の約95%、約90%、約85%、約80%、約75%、約70%、約65%、約60%、約55%、約50%、約45%、約40%、約35%、約30%、約25%、約20%、約15%、約10%、または約5%の減少をもたらす。別の実施形態では、治療は、治療開始後1年の期間内に、液体がん細胞の数の少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%の減少をもたらす。別の実施形態では、治療は、治療開始後6ヶ月の期間内に、液体がん細胞の数の約95%、約90%、約85%、約80%、約75%、約70%、約65%、約60%、約55%、約50%、約45%、約40%、約35%、約30%、約25%、約20%、約15%、約10%、または約5%の減少をもたらす。別の実施形態では、治療は、治療開始後6ヶ月の期間内に、液体がん細胞の数の少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%の減少をもたらす。別の実施形態では、治療は、治療開始後3ヶ月の期間内に、液体がん細胞の数の約95%、約90%、約85%、約80%、約75%、約70%、約65%、約60%、約55%、約50%、約45%、約40%、約35%、約30%、約25%、約20%、約15%、約10%、または約5%の減少をもたらす。別の実施形態では、治療は、治療開始後3ヶ月の期間内に、液体がん細胞の数の少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%の減少をもたらす。
一部の実施形態では、治療は、ヒト対象が化合物で治療されなかった場合、ヒト対象の予想される生存時間と比較して、ヒト対象の生存時間の増加をもたらす。別の実施形態では、ヒト対象の生存時間の増加は、少なくとも30日である。別の実施形態では、ヒト対象の生存時間の増加は、少なくとも3ヶ月である。別の実施形態では、ヒト対象の生存時間の増加は、少なくとも6ヶ月である。別の実施形態では、ヒト対象の生存時間の増加は、少なくとも1年である。
一部の実施形態では、ヒト対象は、液体がんの1つ以上の他の治療に対して、難治性および/または不耐性である。別の実施形態では、ヒト対象は、液体がんの少なくとも1つの以前の治療および/または療法に失敗したことがある。
一部の実施形態では、記載の方法で治療されるヒト対象は、子供(例えば、0~18歳)である。他の実施形態では、記載される方法で治療されるヒト対象は、成人(例えば、18歳以上)である。
キット
本発明は、対象における腫瘍の治療のためのキットを提供する。一部の実施形態では、キットは、固形腫瘍の治療のためのものである。他の実施形態では、キットは、液体腫瘍の治療のためのものである。一部の実施形態では、キットは、血液がんの治療のためのものである。一部の実施形態では、血液がんは、B細胞がんである。一部の実施形態では、血液がんは、白血病、骨髄腫、および/またはリンパ腫である。一部の実施形態では、血液がんは、T細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK+、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30+リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫からなる群から選択される腫瘍の治療のためのものである。一部の実施形態では、キットは、T細胞急性リンパ芽球性白血病(T-ALL)の治療のためのものである。一部の実施形態では、キットは、急性骨髄性白血病(AML)の治療のためのものである。一部の実施形態では、キットは、ヒト対象の治療のためのものである。
一部の実施形態では、キットは、本明細書に提供されるキメラ抗原受容体のいずれかを含む。一部の実施形態では、キットは、本明細書に提供されるキメラ抗原受容体のいずれかをコードする核酸を含む。一部の実施形態では、キットは、本明細書に提供される修飾免疫細胞のいずれかを含む。一部の実施形態では、キットは、CD3 CAR、CD5 CAR、CD7 CAR、CD33 CARおよび/またはCD123 CARを発現する修飾免疫細胞を含む。一部の実施形態では、免疫細胞のうちのいずれかは、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、および/もしくはPD1、またはそれらの組み合わせのうちの1つ以上における変異をさらに含む。
一部の実施形態では、キットは、本明細書に提供される修飾免疫細胞のいずれかの集団を含む。一部の実施形態では、キットは、本明細書に提供される薬学的組成物のいずれかを含む。一部の実施形態では、キットは、CD123修飾免疫細胞の集団、またはCD123修飾免疫細胞もしくは修飾免疫細胞の集団を含む薬学的組成物を含む。一部の実施形態では、キットは、CD5修飾免疫細胞の集団、またはCD5修飾免疫細胞もしくは修飾免疫細胞の集団を含む薬学的組成物を含む。一部の実施形態では、キットは、CD7修飾免疫細胞の集団、またはCD7修飾免疫細胞もしくは修飾免疫細胞の集団を含む薬学的組成物を含む。一部の実施形態では、キットは、CD33修飾免疫細胞の集団、またはCD33修飾免疫細胞もしくは修飾免疫細胞の集団を含む薬学的組成物を含む。一部の実施形態では、キットは、CD3修飾免疫細胞の集団、またはCD3修飾免疫細胞もしくは修飾免疫細胞の集団を含む薬学的組成物を含む。
一部の実施形態では、キットは、塩基エディターポリペプチドまたは塩基エディターポリペプチドをコードするポリヌクレオチドをさらに含み、塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)とデアミナーゼとを含む。一部の実施形態では、napDNAbpは、Cas9またはCas12である。一部の実施形態では、塩基エディターをコードするポリヌクレオチドは、mRNA配列である。一部の実施形態では、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。
本発明は、シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディター、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含むキットを提供し、各ガイドRNAは、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、PD1、CBLB、および/またはCTLA4をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼをコードするヌクレオチド配列は、シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターの発現を駆動する異種プロモーターを含む。
本開示の一部の態様は、核酸構築物を含むキットを提供し、核酸塩基エディターとガイドRNAとをコードするヌクレオチドを含む。一部の実施形態では、核酸構築物は、核酸塩基エディターの発現を駆動する異種プロモーターを含む。一部の実施形態では、本開示は、核酸構築物を含むキットを提供し、(a)本明細書に提供されるシチジンデアミナーゼまたはアデノシンデアミナーゼに融合されたCas9ドメイン(a)をコードするヌクレオチド配列と、(b)(a)の配列の発現を駆動する異種プロモーターと、を含む。一部の実施形態では、Cas9ドメインは、シチジンデアミナーゼに融合される。一部の実施形態では、Cas9ドメインは、アデノシンデアミナーゼに融合される。
一部の実施形態では、キットは、シチジンデアミナーゼ核酸塩基エディターとガイドRNAとを含む。一部の実施形態では、キットは、アデノシンデアミナーゼ核酸塩基エディターとガイドRNAとを含む。一部の実施形態では、キットは、1つ以上のガイド核酸配列をさらに含む。一部の実施形態では、1つ以上のガイド核酸配列は、CD3、CD5、CD7、CD33、またはCD123を標的とする。一部の実施形態では、1つ以上のガイド核酸配列は、各々、CD3、CD5、CD7、CD33、CD123、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、および/またはPD1のうちの1つを標的とする。一部の実施形態では、ガイドRNAは、CD5をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、キットは、核酸塩基エディターとCD5ガイドRNAとを含む。一部の実施形態では、ガイドRNAは、CD7をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、キットは、核酸塩基エディターとCD7ガイドRNAとを含む。一部の実施形態では、ガイドRNAは、CD33をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、キットは、核酸塩基エディターとCD33ガイドRNAとを含む。一部の実施形態では、ガイドRNAは、CD3をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、キットは、核酸塩基エディターとCD3ガイドRNAとを含む。一部の実施形態では、ガイドRNAは、CD123をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。一部の実施形態では、このキットは、シチジンデアミナーゼ核酸塩基エディターとCD123ガイドRNAとを含む。一部の実施形態では、キットは、1つ以上の追加のガイドRNAをさらに含んでもよく、各ガイドRNAは、TRAC、LAG-3、FAS、PD1、B2M、CIITA、TRBC1、TRBC2、および/またはCD52をコードする遺伝子の核酸配列と少なくとも85%相補的な核酸配列を有する。
腫瘍治療キットは、腫瘍の治療において修飾免疫細胞を使用するための書面による説明書をさらに含んでもよい。他の実施形態では、説明書は、注意事項、警告、臨床試験、および/または参考文献のうちの少なくとも1つを含む。説明書は、(存在する場合)容器に直接印刷されてもよく、あるいは容器に適用されるラベルとして、または容器内にもしくは容器とともに、供給される別個のシート、パンフレット、カード、もしくはフォルダとして印刷されてもよい。さらなる実施形態では、キットは、好適な操作パラメータのためのラベルまたは別個のインサート(添付文書)の形態の説明書を含むことができる。さらに別の実施形態では、キットは、適切な陽性対照および陰性対照または対照試料を有する1つ以上の容器を含み、検出、較正、または正規化のための標準として使用され得る。キットは、(滅菌)リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器をさらに含み得る。これには、商業および使用者の観点から望ましい他の材料がさらに含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用説明書を含む添付文書が挙げられる。
本発明の実践には、別段の指示がない限り、分子生物学(組換え技法を含む)、微生物学、細胞生物学、生化学、および免疫学の従来の技術が用いられ、十分に当業者の範囲内である。かかる技術は、文献、例えば、“Molecular Cloning:A Laboratory Manual”,second edition(Sambrook,1989)、“Oligonucleotide Synthesis”(Gait,1984)、“Animal Cell Culture”(Freshney,1987)、“Methods in Enzymology”“Handbook of Experimental Immunology”(Weir,1996)、“Gene Transfer Vectors for Mammalian Cells”(Miller and Calos,1987)、“Current Protocols in Molecular Biology”(Ausubel,1987)、“PCR:The Polymerase Chain Reaction”,(Mullis,1994)、“Current Protocols in Immunology”(Coligan,1991)で十分に説明されている。これらの技術は、本発明のポリヌクレオチドおよびポリペプチドの産生に適用可能であり、したがって、作製および本発明を実施する際に考慮され得る。特定の実施形態のための特に有用な技術は、以下のセクションで論じられる。
以下の実施例は、当業者に、本発明のアッセイ、スクリーニング、および治療方法を作製および使用する方法の完全な開示および説明を提供するために提示されるのであって、本発明者らが彼らの発明とみなすものの範囲を限定するものではない。
実施例1:免疫細胞で発現された遺伝子におけるスプライス部位の破壊および終止コドンの導入
核酸塩基エディターであるBE4を使用して、免疫細胞で発現された遺伝子のサブセットにおいて、スプライス部位を破壊し、終止コドンを挿入した。プラスミド構築物であるpCMV_BE4maxは、BE4をコードし、シチジンデアミナーゼ活性を有するAPOBEC-1シチジンデアミナーゼドメインと、D10A変異を含みかつニッカーゼ活性を有するCas9ドメインと、2つのウラシルDNAグリコシラーゼ阻害因子(UGI)ドメインと、を含む。UGIは、Bacillus subtilisバクテリオファージPBS1に由来する83アミノ酸残基のタンパク質であり、これは、免疫細胞で発現された特定の遺伝子のスプライス部位を編集するのを強力に遮断する。BE4は、N末端およびC末端の核局在化シグナル(NLS)をさらに含む。
>pCMV_BE4max
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACAGCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCCTCAGAGACTGGGCCTGTCGCCGTCGATCCAACCCTGCGCCGCCGGATTGAACCTCACGAGTTTGAAGTGTTCTTTGACCCCCGGGAGCTGAGAAAGGAGACATGCCTGCTGTACGAGATCAACTGGGGAGGCAGGCACTCCATCTGGAGGCACACCTCTCAGAACACAAATAAGCACGTGGAGGTGAACTTCATCGAGAAGTTTACCACAGAGCGGTACTTCTGCCCCAATACCAGATGTAGCATCACATGGTTTCTGAGCTGGTCCCCTTGCGGAGAGTGTAGCAGGGCCATCACCGAGTTCCTGTCCAGATATCCACACGTGACACTGTTTATCTACATCGCCAGGCTGTATCACCACGCAGACCCAAGGAATAGGCAGGGCCTGCGCGATCTGATCAGCTCCGGCGTGACCATCCAGATCATGACAGAGCAGGAGTCCGGCTACTGCTGGCGGAACTTCGTGAATTATTCTCCTAGCAACGAGGCCCACTGGCCTAGGTACCCACACCTGTGGGTGCGCCTGTACGTGCTGGAGCTGTATTGCATCATCCTGGGCCTGCCCCCTTGTCTGAATATCCTGCGGAGAAAGCAGCCCCAGCTGACCTTCTTTACAATCGCCCTGCAGTCTTGTCACTATCAGAGGCTGCCACCCCACATCCTGTGGGCCACAGGCCTGAAGTCTGGAGGATCTAGCGGAGGATCCTCTGGCAGCGAGACACCAGGAACAAGCGAGTCAGCAACACCAGAGAGCAGTGGCGGCAGCAGCGGCGGCAGCGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCC

TACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACAGCGGCGGGAGCGGCGGGAGCGGGGGGAGCACTAATCTGAGCGACATCATTGAGAAGGAGACTGGGAAACAGCTGGTCATTCAGGAGTCCATCCTGATGCTGCCTGAGGAGGTGGAGGAAGTGATCGGCAACAAGCCAGAGTCTGACATCCTGGTGCACACCGCCTACGACGAGTCCACAGATGAGAATGTGATGCTGCTGACCTCTGACGCCCCCGAGTATAAGCCTTGGGCCCTGGTCATCCAGGATTCTAACGGCGAGAATAAGATCAAGATGCTGAGCGGAGGATCCGGAGGATCTGGAGGCAGCACCAACCTGTCTGACATCATCGAGAAGGAGACAGGCAAGCAGCTGGTCATCCAGGAGAGCATCCTGATGCTGCCCGAAGAAGTCGAAGAAGTGATCGGAAACAAGCCTGAGAGCGATATCCTGGTCCATACCGCCTACGACGAGAGTACCGACGAAAATGTGATGCTGCTGACATCCGACGCCCCAGAGTATAAGCCCTGGGCTCTGGTCATCCAGGATTCCAACGGAGAGAACAAAATCAAAATGCTGTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAGGAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
免疫細胞におけるタンパク質発現のノックダウンまたはノックアウトにおけるBE4の有効性を確認するために、免疫細胞の第1の集団を、BE4をコードするmRNAと、特異的な標的部位に応じて、TRACエキソン2、TRACエキソン4、またはB2Mエキソン1のドナーもしくはアクセプタースプライス部位のG塩基に相補的なC塩基を標的とするsgRNAと、を共トランスフェクトした。mRNAは、インビトロ転写によって産生した(TriLin Biotechnologies)。簡潔には、4μgのBE4 mRNAおよび2μgの合成gRNAを、1M CD3+T細胞(Nucleofector(商標)Platform,Lonza Bioscience)にエレクトロポレーションした。次いで、細胞を3日間培養して、塩基編集に十分な時間を与えた。比較のために、免疫細胞の第2の集団を、Cas9ヌクレアーゼをコードするmRNAと、B2Mエキソン1のドナースプライス部位のG塩基を標的とするsgRNAと、を共トランスフェクトした。BE4編集とCas9編集との間に識別可能な差は観察されず、各編集された遺伝子のノックダウンは90%を超えたが、非電気穿孔対照細胞は、有意なノックダウンを有しなかった(図2)。
細胞を、一本鎖ニックを触媒するBE4をコードするmRNA、または二本鎖切断を触媒するCas9ヌクレアーゼを用いてトランスフェクトした場合、観察される標的化遺伝子のノックダウンを担う遺伝子修飾は異なるであろうと仮定した。この仮説を試験するために、免疫細胞を、BE4塩基エディターをコードするRNAと、B2Mエキソン1のドナースプライス部位のG塩基を標的とするsgRNAとの、2μgのBE4/1μgのsgRNA(中)または4μgのBE4/2μgのsgRNA(高)のいずれかを用いて共トランスフェクトした。3、5、および7日間インキュベーションした後、DNAを回収および配列決定した。図3を参照すると、塩基編集の大部分は、スプライス部位のみの破壊を明らかにし、予想された様式であった(すなわち、アンチセンス鎖におけるCからTへの遷移が組み込まれ、センス鎖におけるGからAへの遷移が生じた)。これらの結果は、Cas9ヌクレアーゼでトランスフェクトされた細胞から得られた結果とは対照的であり、Cas9でトランスフェクトされた細胞における編集のほとんどがインデルであったことを示す(図3)。
スプライス部位の破壊および終止コドンの導入は、標的遺伝子の発現をノックダウンするのに有効であり得る。TRACエキソン4におけるスプライスアクセプター、ならびにB2Mエキソン1およびPDCD1エキソン1におけるスプライスドナーのBE4媒介性編集は、全長タンパク質の発現の低下をもたらした(図4および5)。スプライス部位において観察されたBE4媒介性の変化は、CからTのトランジション(transition)であったが、インデルおよびCからGのトランスバージョン(transversion)も観察された。PDCD1遺伝子のエキソン2へのオーカー終止コドンの挿入(エキソン内の連続したシチジン残基が標的化され、チミジン残基に編集されたもの)もまた、TRACおよびB2M遺伝子で見られるものよりも少ない減少ではあるが、遺伝子発現の有意なノックダウンをもたらした(図4)。これらの結果は、免疫細胞で発現された遺伝子のBE4媒介性の単一のまたは連続したシチジン塩基編集が、遺伝子発現の効率的な減少をもたらすことをさらに示唆する。
実施例2:スプライス部位破壊および終止コドン挿入のインシリコ解析
設計されたgRNAがオフサイト標的に結合するかどうかを決定するために、gRNAの核酸配列を、CAS-OFFinderを使用して分析した。図6を参照すると、「X」バルジタイプは、gRNAがゲノムDNAと整列し、いかなる相違も不一致であることを示す。不一致の数が1から4に増加するにつれて、オフサイト結合の可能性が増加する。例えば、TRACエキソン4スプライスアクセプターの結果は、3つの不一致がある場合、26のオフサイト結合の可能性があり、4つの不一致の場合、164のオフサイト結合があることを示す。
gRNAがバルジを有し、gRNAが20塩基対を有するが、ゲノムDNAと19塩基対整列する場合、バルジが生じる。再び図6を参照すると、TRACエキソン4スプライスアクセプターgRNAが1塩基対のバルジを有する場合、不一致が増加するにつれて、オフサイト結合の可能性の数が増加するが、可能性の数は、バルジがない場合(すなわち、バルジサイズがゼロである場合)よりも有意に減少する。
実施例3:免疫細胞における多重塩基編集
BE4が複数の遺伝子の塩基編集を媒介してマルチノックダウン細胞を生成できるかどうかを判定するために、免疫細胞を、B2M、TRAC、PD1、またはそれらの組み合わせにおける特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共トランスフェクトした。図7を参照すると、BE4システムは、フローサイトメトリーによって測定すると、有効なノックダウンを誘発し、単一、二重、および三重の遺伝子編集における減少したタンパク質産生を有する細胞の割合を特定した。細胞を、B2M発現およびCD3発現に対してゲーティングし、CD3発現を、TRAC発現の代わりに機能させた。PD1染色が非効率であるため、このタンパク質を発現する細胞の直接測定は行わなかった。単一、二重、および三重の遺伝子編集を有する細胞集団間で、差異は観察されず、B2M、TRAC、およびPD1(三重遺伝子編集)の発現をノックダウンするように修飾された免疫細胞は、非修飾対照免疫細胞とは検出可能に異なる(図8)。
図9に、タンパク質発現の低下を担う遺伝子に対する修飾を要約する。具体的には、実施例1に記載の単一遺伝子修飾における発現の低下をもたらす機序と同様に、CからTのトランジションは、修飾B2M単一修飾遺伝子細胞集団、ならびにB2M+PD1、B2M+TRAC、およびB2M+TRAC+PD1多重修飾遺伝子細胞集団において観察される膨大な数の編集を構成する。インデルおよびトランスバージョンは、編集された遺伝子において観察された遺伝子変化のわずか少数を構成する。
したがって、ベース編集による3つの遺伝子座の同時修飾は、一方向標的化配列決定(UDiTaS、Giannoukos et al.,BMC Genomics.2018 Mar 21;19(1):212.doi:10.1186/s12864-018-4561-9)によって評価されるように、検出可能な転座事象のない非常に効率的な遺伝子ノックアウトを生み出した。さらに、BE4で編集された遺伝子では、転座が検出されなかった。ドロップレットデジタルポリメラーゼ連鎖反応(ddPCR)戦略(図10)を用いて、B2M、TRAC、およびPD1BE4で編集された遺伝子間で、転座を検出した。BE4またはCas9を用いて修飾してB2M+TRAC+PD1編集を生成した細胞から抽出したDNAを、QX200ドロップレットデジタル機器(Bio-Rad)を使用して、次世代配列決定(NGS)を用いて分析して、BE4およびCas9編集の正確な配列を決定した。図11の左パネルに示されるように、B2M、TRAC、およびPD1遺伝子は、ほとんどの細胞で修飾された。ddPCR分析は、転座が、BE4で編集された細胞には存在しないが、Cas9で編集された細胞の約1.7%で観察されたことを示した(図11、右パネル)。表21は、転座がBE4編集細胞において観察されなかったことをさらに示す。
実施例4:Cblがん原遺伝子B(CBLB)のBE4媒介性編集
Cbl-bは、T細胞受容体(TCR)シグナル伝達タンパク質であり、TCR複合体シグナル伝達を負に調節する(図12)。Cbl-bシグナル伝達が阻害されると、T細胞はより低い活性化閾値を有するため、この遺伝子をノックアウトまたはノックダウンすることは、T細胞またはCARを発現するT細胞の有効性を有意に改善することができる。Cbl-b遺伝子がシチジン脱アミノ化媒介性修飾に感受性であったかどうかを判定するために、細胞を、BE4をコードするmRNAと、エキソン8および16のスプライス部位アクセプター、エキソン8、10、11、および12のスプライス部位ドナーを標的とするか、またはエキソン1、4、および8における終止コドンの挿入を促進させるsgRNAとを用いて、共トランスフェクトした。得られた細胞をフローサイトメトリーで分析した。
図13を参照すると、エキソン12のスプライス部位ドナーおよびエキソン8のスプライス部位アクセプターの破壊は、Cbl-b発現の最大の減少(それぞれ67.2%および57.4%)をもたらした。エキソン8スプライス部位アクセプターおよびエキソン12スプライス部位ドナーsgRNAでトランスフェクトした細胞のうち、60%をわずかに超える細胞が正常に編集された(図13、棒グラフ)。
実施例5:免疫細胞におけるCas12bヌクレアーゼの特徴付け
Cas12b/c2c1部位は、二本鎖核酸分子の両方の鎖を特異的に標的化し、切断する。2つの異なるCas12b/c2c1タンパク質(BhCas12bおよびBvCas12b)を、標的核酸分子内のインデルを媒介する酵素の傾向を決定することによって特徴付けた。Cas12b/c2c1タンパク質をコードするmRNAを、GRIN2B遺伝子の遺伝子座およびDNMT1遺伝子の遺伝子座に特異的なガイドRNAとともに、T細胞にエレクトロポレーションした。細胞を3~5日間培養し、続いて、細胞のDNAを単離した。インデルの割合を、次世代配列決定によって決定した。図14を参照すると、GRIN2B遺伝子において、BhCas12bタンパク質で処理した細胞から単離されたDNAは、BvCas12bタンパク質で処理した細胞から単離されたDNA(約20%)よりも、はるかに高い割合(約75%)のインデルを有した。DNMT1遺伝子におけるインデルもまた、BhCas12bで処理した細胞から単離されたDNA(約20%)は、BvCas12bで処理した細胞から単離されたDNA(約0%)よりも高い割合で観察された。
BhCas12b(V4)タンパク質を使用して、TRAC遺伝子を破壊した。GRIN2B、DNMT1、およびTRAC遺伝子の遺伝子座に特異的なガイドRNAとともにBhCas12b(V4)タンパク質をコードするmRNAを用いたエレクトロポレーションを介して、T細胞を形質導入した。エレクトロポレーションの96時間後、細胞を、蛍光支援細胞選別(FACS)分析を使用して評価し、細胞を(TRACの代わりに)CD3に対してゲーティングした。図15を参照すると、GFPをコードするプラスミドと、またはBhCas12b(V4)と、GRIN2BもしくはDNMT1に特異的なガイドRNAと、を用いて形質導入されたT細胞の約95%は、CD3+であった。BhCas12b(V4)とTRAC遺伝子の遺伝子座に特異的なガイドRNAとを発現するように形質導入された細胞は、CD3+である可能性が低かった(使用されるガイドRNAに応じて約2%~約50%)。試験した11個のTRACガイドRNAのうちの3個は、約100%BhCas12b(V4)媒介性インデルをもたらした。
実施例6:CAR-P2A-mCherryレンチウイルス発現の特徴付け
細胞を、CAR-P2A-mCherryレンチウイルスを使用してキメラ抗原受容体(CAR)を発現するように形質導入し、蛍光支援細胞選別(FACS)を使用してCAR発現について分析した。細胞を染色せずに、Rフィコエリスリン(PE)またはフルオレセインイソチオシアネート(FITC)にコンジュゲートしたBCMAタンパク質とインキュベートした。BCMAは、CARの標的とされた抗原であるため、CARを発現する細胞は、色素標識BCMAに結合する。図16を参照すると、染色されなかった細胞について、FACS分析は、形質導入された試料中のmCherryの存在のみを検出した(PEチャネルへのいくらかのスピルオーバー(spillover)を伴う)。BCMA-PEチャネルは、スピルオーバーで見られたシグナルを超えて非常に陽性のシグナルを示し、これらの結果は、BCMA-FITCとインキュベートされた細胞において確認された。色素標識BCMAタンパク質の検出結果は、mCherryについて見られるものとほぼ同一のCAR発現を示唆する。図17を参照すると、FACS分析を介して、ポリ(1,8-オクタンジオールクエン酸塩)(POC)レンチウイルスベクターで形質導入された細胞において、85%のCAR発現が検出された。
実施例7:BE4は、高い生成物純度を有する効率的で耐久性のある遺伝子ノックアウトを生成する。
BE4は、マルチノックダウン細胞を生成するために、複数の遺伝子の塩基編集を媒介する。免疫細胞を、B2M、TRAC、PD1、またはそれらの組み合わせにおける特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共トランスフェクトした。配列決定データによって示されるように、塩基編集は、細胞を修飾するのに効率的であり、少なくとも7日まで持続した(図18)。高い生成物純度が観察され、CからTのトランジションが、観察された膨大な数の編集を構成した。インデルならびにCからGおよびCからAのトランスバージョンは、編集された遺伝子において観察された遺伝子変化のわずか少数を構成した。塩基編集はまた、所望の修飾を生成することにおいて、spCas9ヌクレアーゼと同様に効率的であった。
BE4システムは、フローサイトメトリーによって測定すると、効果的なノックダウンを誘発し、表面発現が減少した細胞の割合を特定した(図19A)。B2M発現に対してゲーティングされた細胞は、細胞表面上のB2Mタンパク質の喪失を示した。フローサイトメトリーによって測定した場合、塩基編集はまた、B2Mタンパク質のノックアウトを生成することにおいて、spCas9ヌクレアーゼと同様に効率的であった。
実施例8:直交転座検出アッセイ(orthogonal translocation detection assay)は、三重編集T細胞におけるBE4誘発性再編成を検出することができない
免疫細胞を、B2M、TRAC、およびPD1における特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共トランスフェクトした。B2M、TRAC、およびPD1標的遺伝子間で望ましくない特定の転座を検出することができる転座検出アッセイを使用して、三重編集T細胞を評価した(図20)。注目すべきことに、BE4で編集された遺伝子のいずれにおいても、これらの特定の転座は検出されなかった(表22)。対照的に、Cas9で処理された細胞は、低いものの、検出可能なレベルの転座を示した。したがって、BE4塩基エディターを使用したT細胞の多重編集は、Cas9ヌクレアーゼを使用した多重編集とは対照的に、転座を生成しなかった。
実施例9:多重化塩基編集は細胞増殖を著しく損なわない
BE4とspCas9 sgRNAの両方を用いて、B2M、TRAC、およびPD1標的にわたって、広範なガイドのスクリーニングを行った。ガイドを、シングルプレックス試験に基づいて、高い編集効率および増殖について選択した。最終細胞収率は、BE4およびspCas9を使用して1、2、および3つの編集間で比較し、エレクトロポレーションのみの対照に対して正規化した。所望の編集を有するBE4編集細胞は、最大3つの編集を行った場合、高い収率を示した(図21)。対照的に、spCas9編集細胞は、多重編集の数を増やした場合、収率の減少を示した。したがって、多重塩基編集細胞は、最大3つの編集が行われた場合でも、高い細胞増殖を維持した。したがって、BE4は、spCas9で処理した試料と比較して、高い細胞増殖を維持しながら、検出可能なゲノム再編成を有しない多重編集T細胞を生成した。
実施例10:BE4は、spCas9と同様のオンターゲット編集効率および細胞表現型を有する三重編集T細胞を生成した
T細胞を、B2M、TRAC、およびPD1における特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共トランスフェクトした。配列決定データによって示されるように、塩基編集は、3つすべての部位で細胞を修飾するのに効率的であった(図22)。塩基編集による遺伝子の修飾は、spCas9ヌクレアーゼを使用したものと同様であった。フローサイトメトリーはまた、B2MおよびCD3の表面発現の減少を示した(図23、上部パネル)。エレクトロポレーションのみの対照細胞と比較して、BE4およびCas9多重編集細胞は、細胞表面上のB2MおよびCD3タンパク質の有意な減少を示した(>95%のCD3/B2M)。PD1染色の効率は低いが、エレクトロポレーションのみの対照細胞と比較して、BE4およびCas9多重編集細胞において、PD1の有意な減少(約90%)が観察された(図23、下部パネル)。
実施例11:BE4編集はCAR発現または抗原依存性細胞死滅を変化させない
T細胞を、B2M、TRAC、およびPD1における特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共トランスフェクトした。抗BCMA CARをコードするレンチウイルスベクターの組み込みにより、BCMAを標的とするキメラ抗原受容体(CAR)を導入した。CAR発現は、フローサイトメトリーによって、レンチウイルスベクターを受容しなかった未処置細胞と比較して、BE4およびCas9編集細胞において観察された(図24)。CAR-T細胞を、BCMAを発現する細胞の核染色および細胞死を示す核染色の喪失を検出することによって、細胞死について評価した。BE4およびCas9編集T細胞を含む、ベクターで形質導入されCARを発現する細胞において、抗原依存性の細胞死滅が観察された(図25)。対照的に、ベクターで形質導入されなかった未処理細胞は、細胞死滅活性を示さなかった。したがって、BE4で産生されたCAR-T細胞は、ヌクレアーゼのみの対応物と比較して、同等の遺伝子破壊、細胞表現型、および抗原依存性の細胞死滅を示した。
実施例12:Cas12bおよびBE4は、T細胞における高効率の多重編集のために対にされ得る
CD3B2MT細胞を、BE4のみを使用して、またはBE4およびCas12bを使用して生成した。BE4のみを使用して生成されたT細胞について、T細胞を、B2MおよびTRACにおける特定の部位を標的とするsgRNAとともに、BE4塩基エディターをコードするmRNAで共コトランスフェクトした。BE4およびCas12bを用いて生成されたT細胞について、BE4塩基エディターをコードするmRNAと、B2Mにおける特異的部位を標的とするsgRNA、BhCas12b(V4)をコードするmRNA、およびTRAC遺伝子のエキソン4を標的とするCas12b sgRNA(TRAC遺伝子を破壊するのに使用された)と、を用いて共トランスフェクトした。得られたT細胞を、B2MおよびCD3の細胞表面発現を検出するために、蛍光支援細胞選別(FACS)分析を使用して評価した。BE4のみを使用したノックアウトは、BE4およびCas12bを使用したノックアウトと同様のプロファイルを示した。特に、高い割合のT細胞が、CD3B2M:86%(BE4のみ)および88%(BE4+Cas12b)であり、一方、他の可能な表現型であるCD3B2M、CD3B2M、およびCD3B2MT細胞は、細胞集団では、あまり表されていなかった(図26)。対照的に、エレクトロポレーションのみの対照は、CD3B2M細胞の割合が高い集団(97.8%)およびCD3B2M細胞の割合が非常に低い集団を示した。
Cas12bを使用して、CD3CART細胞を生成した。T細胞を、BhCas12b(V4)をコードするmRNA、TRAC遺伝子のエキソン4を標的とするCas12b sgRNA、および抗BCMA CARをコードする二本鎖DNA(dsDNA)ドナー鋳型で共トランスフェクトした。T細胞を、CD3およびBCMA細胞表面発現を検出するために、蛍光支援細胞選別(FACS)分析を使用して評価した。sgRNAの存在下でCas12bの量を増やして細胞に導入した場合、細胞集団のCD3象限へのシフトから分かるように、CD3の発現が減少した(図27)。同じ条件下で、ドナー鋳型の量を増やして細胞に導入した場合、細胞集団のCD3CAR象限へのシフトが観察された。
したがって、Cas12bをBE4と対にして多重編集T細胞を生成し、複数の二本鎖切断によって引き起こされるゲノム再編成を最小化することができる。
実施例13:動物モデルにおけるインビボ有効性
本明細書に記載の化合物の抗発がん性活性をインビボで決定するために、化合物は、例えば、単独で(IP、IV、PO、吸入または経鼻経路による)投与されるか、または関連する化学療法剤(例えば、シクロホスファミド、ドキソルビシン、エトポシド)の最適以下の用量と組み合わせて投与される。一実施例では、ルシフェラーゼを安定的に発現する5×10個のRS4;11細胞(急性リンパ芽球性白血病を有する対象の骨髄から樹立された細胞)を、全身照射を受けて3時間後のNOD-SCIDマウスに、尾静脈を介して注入する。未処置のままであれば、このタイプの白血病は、このモデルでは、3週間で致命的である。白血病は、例えば、マウスにD-ルシフェリン(60mg/kg)を注入し、麻酔された動物(例えば、Xenogen In Vivo Imaging System、Caliper Life Sciences、Hopkinton,MA)を撮像することによって容易に監視される。全身生物発光は、Living Image Software(Caliper Life Sciences、Hopkinton,MA)によるフォトニックフラックス(光子/秒)の積分によって定量される。本明細書に記載の化合物は、単独でまたは最適以下の用量の関連する化学療法剤と組み合わせて、例えば、白血病マウスに、尾静脈またはIP経路によって、0.1mg/kg~50mg/kgの範囲の用量で7~21日間投与される(注射後10日間/実験1日目、生物発光範囲14~16)。任意選択的に、マウスは、実験全体を通して隔日で撮像され、生存率は、実験期間中、毎日監視される。息を引き取ったマウスは、任意選択的に、実験の終了時に剖検を受ける。別の動物モデルは、NOD-SCIDマウスへの、ルシフェラーゼを安定的に発現するヒト濾胞性リンパ腫に由来する細胞株DoHH2の移植である。これらのインビボ試験は、任意選択的に、予備的な薬物動態、薬力学、および毒性データを生成する。
実施例14:臨床試験
本明細書に記載の化合物がヒトの治療に適しているかどうかを決定するために、臨床試験を実施する。例えば、液体がんと診断され、治療を必要とする対象は、治療群および1つ以上の対照群において選択および分離され得、治療群は、本明細書に記載の化合物が投与され、対照群は、プラセボまたは既知の抗がん剤が投与される。したがって、本明細書に記載の化合物の治療安全性および治療有効性は、生存および生活の質などの要因に関して、対象群の比較を行うことによって評価することができる。この実施例では、本明細書に記載の化合物で治療された対象群は、プラセボで治療された対象対照群と比較して、改善された長期生存を示すことができる。
試験設計
この試験は、用量漸増2群比較試験を含み、WTp53タンパク質を発現する液体リンパ腫(例えば、白血病、骨髄腫、または液体リンパ腫)を有する対象において、28日サイクルまたは21日サイクルの2つの異なる投薬レジメンを使用して、IV注入によって投与される化合物の安全性、耐容性、PK、PD、および液体がんに対する細胞効果を評価するように設計された。例えば、本明細書に記載の化合物は、再発性/難治性急性骨髄性白血病(AML)および/または急性リンパ性白血病(ALL)を有する対象において使用され得る。対象は、28日サイクルでは3週間連続で週1回、または21日サイクルでは2週間連続で週2回のいずれかで、本明細書に記載の化合物を受ける。液体リンパ腫を有する多くの対象は、末梢血中に循環腫瘍細胞(CTC)を有し、フローサイトメトリーを使用して、これを検出および分析することができる。したがって、これらの細胞における治験薬特異的標的結合の検出が可能である。
この試験は、用量漸増期(DEP)および拡張期(EXP)からなる。DEPは、本明細書に記載の化合物のMTDまたはOBDを確立するための「3+3」用量漸増設計である。EXPは、用量レベルの臨床安全性プロファイルおよび潜在的有効性をさらに調査するために、MTDまたはOBDで特定の液体がんを有する最大2つの異なる対象群を登録する。EXPの対象の選択は、DEPの結果ならびに追加の非臨床薬理試験からのデータに基づいて確定される。後者は、本明細書に記載の化合物に対する細胞株感受性の比較を促進する複数の液体がん細胞株(例えば、白血病、液体リンパ腫、骨髄腫など)の液体がん種間および液体がん種内での調査を含む。
本試験の用量漸増期および用量拡張期における対象の処置は、疾患の進行、許容できない毒性、または対象もしくは医師による療法の中止の決定の文書化まで続く。
MTDまたはOBDを確立した後、追加の対象を最大2つの別個の拡大コホート(1拡大コホート当たり約30人の対象)に登録して、この用量レベル、および特に、対象または液体がん細胞型でのさらなる経験を積むことができる。対象または液体がん細胞型の選択は、部分的には、試験の用量漸増部分で行われた観察に基づいて決定される。
安全性は、有害事象(AE)の発生率、重症度、期間、因果関係、重篤度、および種類、ならびに対象の身体検査、バイタルサイン、および臨床検査結果の変化に基づいて評価される。治験担当医師は、NCI CTCAEバージョン4.0を使用して、有害事象の重症度を評価する。
この試験の主な目的は安全性およびPKに基づいているため、統計解析は本質的に記述的であり、試験されたすべての用量およびすべての観察された奏効を説明するもので、IWG(2014)基準に基づいて、完全奏効(CR)もしくは部分奏効(PR)を達成した対象、または安定した疾患(SD)を維持した対象が含まれる。本明細書に記載の化合物の少なくとも1つの用量を受ける対象は、安全性集団を構成し、すべての安全性解析に含まれる。本明細書に記載の化合物の少なくとも1つのサイクルを完了し、処置後の客観的疾患評価を受ける対象は、有効性が評価可能な対象集団を構成する。
実施例15:遺伝子を特定およびサイレンシングするための例示的な方法
本実施例では、CAR-Tの標的の遺伝子をサイレンシングする方法を提供する。図28Aの図は、標的化される遺伝子およびそれに関する考慮事項を提供する。標的として、例えば、CD4、CD5、CD7、CS-1、TRAC、CAR、FAS、LAG-3、PD-1、β2M、CD52、およびTCRのうちの1つ以上が挙げられる。
塩基エディターでサイレンシングするには、2つの戦略がある。第1の戦略は、標的タンパク質を評価し、次いで、グルタミン、アルギニン、またはトリプトファンのうちの1つ以上を終止コドンに変えて、タンパク質発現をサイレンシングする(図28Bの項目1を参照されたい)。第2の戦略は、CBEによるスプライス破壊を伴い、タンパク質発現をサイレンシングする(図28Bの項目2を参照されたい)。
実施例16:複数のCAR-T集団を用いて、AMLまたはT-ALLにおける疾患のクローン性に対処する
白血病は、腫瘍微小環境における選択圧に起因するクローン増殖およびクローン選択の反復プロセスを通して疾患の進化に起因する特定の療法に照らして、耐性または再発性になることが企図される。例として、AMLがん細胞の異なるクローンは、CD33+CD123-、CD33+CD123+、またはCD33-CD123+などの様々な抗原を示すことができる。CD33+がん細胞を標的とする治療剤は、CD33-CD123+などのこの特定の抗原を欠く細胞に対処しないであろう。したがって、本明細書に記載の複数のCAR-T細胞集団は、疾患のクローン性に対処することが企図される。
例示的な方法では、CD33およびCD123 CAR-T細胞が、図29に示されるように生成される。CD33およびCD123 CAR-T細胞は、CD33+CD123+AMLのマーカーを有するAML患者に投与される。CD33およびCD123 CAR-T細胞は、CD33+CD123-、CD33+CD123+、およびCD33-CD123+である患者のAMLがん細胞を排除する。
別の例示的な方法では、CD3およびCD7 CAR-T細胞は、図30に例示されるように、本明細書に記載の方法によって生成される。CD3およびCD7 CAR-T細胞は、CD3+CD7+T-ALLのマーカーを有するT-ALL患者に投与される。CD3およびCD7 CAR-T細胞は、CD3+CD7-、CD3+CD7+、およびCD3-CD7+であるT-ALLがん細胞を排除する。
実施例17:複数のCAR-T集団は、フラトリサイドを排除するように修飾される
従来のT細胞療法およびCAR-T療法の主な制限は、活性化された細胞が、細胞の製造・貯蔵中に、または患者に注入されたときに、自己死滅またはフラトリサイドを起こし得ることである。フラトリサイドを回避するために、本明細書に記載のCAR-T細胞は、細胞のCARが特異的である抗原をコードするポリヌクレオチドに変異を含むように修飾される。例として、CD7 CAR-T細胞は、フラトリサイドを防止するためにCD7ポリヌクレオチドに変異を含むように修飾される。別の例として、CD3CAR-T細胞は、フラトリサイドを防止するために、CD3ポリヌクレオチドに変異を含むように修飾される。複数のCAR-T集団において、クロスフラトリサイドを防止するために、追加の修飾が行われる(すなわち、両方のCAR-T集団でのCD3およびCD7ポリヌクレオチドの両方における変異)。さらなる修飾には、免疫抑制、移植片対宿主、宿主対移植片などに関与し得る遺伝子への変異が含まれる。
例示的な方法では、AMLの治療のためのCD33およびCD123 CAR-T細胞が、図29に示されるように生成される。CD33およびCD123 CAR-T細胞の両方は、細胞が自身を標的としないように、CD33に変異を有するように修飾される。PD-1、CD52、およびTRACにおけるさらなる変異は、それぞれ、免疫抑制、宿主対移植片、および移植片対宿主を低減または防止する。
例示的な方法では、T-ALLの治療のためのCD3およびCD7 CAR-T細胞が、図30に示されるように生成される。CD3およびCD7 CAR-T細胞の両方は、細胞が自身または他の集団を標的としないように、CD3(TRAC)およびCD7に変異を有するように修飾される。PD-1、CD52、およびTRACにおけるさらなる変異は、それぞれ、免疫抑制、宿主対移植片、および移植片対宿主を低減または防止する。
実施例18:T-ALL CAR-T細胞の4つの同時塩基編集は、ヌクレアーゼと比較して収率に影響を及ぼさない
quad-T-ALL編集の文脈での理論的収率は、アッセイで決定され、以下の成分が試験された。対照は、エレクトロポレーションなし(EPなし)、EPのみ、CBEバリアント1、CBEバリアント2、およびCas9である。その結果を図31Aに示し、対応する生存率の結果を図31Bに示す。T-ALL CAR-Tに対する4つの同時塩基編集が、ヌクレアーゼと比較して、収率に影響を及ぼさないと判断された。
実施例19:スケールアップしたLonzaエレクトロポレーションは、T-ALL CAR-T細胞プログラムのための高効率の多重T細胞塩基編集を誘導する。
T細胞は、活性化後、3日間培養した。5×10個の細胞を、エディター用の10μgのmRNA(CBE1、CBE2、またはspCas9)と、T-ALLガイド用の5μgのsgRNA(TRAC、CD52、CD7、PD1)とを用いてエレクトロポレーションした。以下の表23に、好適なガイドが提供されている。
2’-O-メチル類似体と3’ホスホロチオエートとのヌクレオチド間結合は、RNA残基の最初の3つの5’末端および3’末端で使用され、各末端での化学修飾は、ヌクレオチドの後に「s」で示されている。
CBE1は、ラットAPOBEC-BE4を指し、CBE2は、オランウータン「BE4」(ppAPOBEC)を指す。EPなしおよびEPのみは、zapなしまたはエディター/ガイドなしのzapのいずれかを有する対照であった。
理論的収率を以下のように測定した:細胞を、AO/DAPI染色を使用した生存率測定により、毎日カウントした(生存率の読み出しは、EP生存率の読み出し後数時間のカウント-AML図でも実施された)。細胞を毎日0.5×10細胞/mLに分割し戻した(split back)(理論的に、分割により事実上すべての細胞増が増殖しないため)。次いで、培養物がバックスプリット(backsplit)されていなかった場合の理論的収率を決定するために、計算を行った。遺伝子修飾の割合を決定した(図32)。
細胞をNGSを介して取得し、理論的な細胞収率を決定した(図33)。
モデル腫瘍細胞における蛍光マーカーの喪失によって実証された細胞死滅(図34)。
試験したすべてのCARは、重鎖から軽鎖配向(H2L)または軽鎖から重鎖配向(L2H)のいずれか、続いて、CD8aヒンジ、CD8膜貫通ドメイン、およびCD28zシグナル伝達ドメインの結合剤クローンを含む。
実施例20:例示的なCAR-T細胞プロセスフローおよび契約製造
健常なドナー由来の凍結アフェレーシスロイコパックを入手し、製造元の説明書に従って、Pasmathermを使用して解凍する。CD4およびCD8 T細胞を、例えば、製造元の説明書に従って、CliniMACS Prodigyを使用して単離する。T細胞を、次いで、製造元の説明書に従って、TransActを使用して活性化する。mRNA/RNP塩基エディターのエレクトロポレーション送達は、製造元の説明書に従って、CD3、CD7、CD52、および/またはPD1をノックアウトするためのLonza 4D Nucleofactorを使用して生じる。TCRα/βの枯渇は、当該技術分野で認められた技術を使用して実施される。T細胞を増殖させ、3CARおよび7CARのレンチウイルス形質導入を行う。CAR-T細胞を、制御速度フリーザー(CRF)で凍結保存する。
実施例21:CAR-T細胞によるT-ALLの治療
T細胞急性リンパ芽球性白血病(T-ALL)は、骨髄の侵襲性悪性腫瘍である。ALL症例の約12~15%が小児で診断されている。再発後の5年生存率は、25%未満である。標準的なケアは、化学療法を使用して第2の寛解を誘導し、続いて、同種造血幹細胞移植(alloHSCT)を誘導することである。しかしながら、多くの患者は、化学療法に抵抗性であるか、または高い腫瘍負荷を有し、alloHSCTの架け橋として完全寛解(deep remission)を誘導することができない。さらに、重度に前治療された患者は、多くの場合、自己CAR-T治療の候補ではない。したがって、T-ALLの治療のための代替治療オプションが必要である。
alloHSCTでの治療を橋渡しするために、編集されたCAR-T細胞が患者において完全寛解を誘導できるかどうかを調べるために、多重編集を使用して、フラトリサイド耐性のCAR-T細胞を生成した。図35に示されるように、CD3CD7またはCD3CD7T-ALL腫瘍細胞を標的として、CD7キメラ抗原受容体を発現するT細胞を編集して、CD7、TRAC、CD52、およびPD-1の発現を低減または排除した。図36に示されるように、リンパ枯渇は、約20~30人のT-ALL患者において、Cy/Flu/Campathを用いて、-7日目に実施した。0日目に、患者に、CD7 CAR-T細胞を注入した。次いで、65日目に、患者は、Cy/Flu/TBI/ATGで事前調整された。70日目に、患者は、alloHSCTによる処置を受けた。CD7 CAR-T細胞による処置は、T細胞形成不全を誘導し、T-ALL患者をブリッジ治療なしでalloHSCTで治療することが可能になると予想される。
実施例22:CD7 CAR-T細胞の産生
図37Aに示されるように、TALL017 CD7 CAR-T細胞を産生するために、健常なドナーから凍結アフェレーシスを受けた。次いで、アフェレーシスを、Plasmatherm(Barkey GmbH&Co.KG)で解凍した。CD4およびCD8T細胞を、CliniMACS Prodigy(Miltenyi Biotec)を使用して、解凍されたアフェレーシスから単離した。2日目に、mRNA塩基エディターおよびガイドRNAを、Lonza SD Nucleofectorを使用して、エレクトロポレーションによりT細胞に送達した。塩基編集後、CD7キメラ抗原受容体(CAR)を、レンチウイルス形質導入を介してT細胞に送達した(7CAR8)。次いで、T細胞を、2~8日目の培養で増殖させた。次いで、増殖後、回収したCAR-T細胞(>1B)を凍結保存した。解凍時、TALL017プロセスで、異種細胞集団を産生した。
未形質導入(UTD)および形質導入TALL017細胞を、解凍後24時間と比較した。CAR活性化は、フローサイトメトリーを使用して、CD2+およびCD4+細胞に対して細胞をゲーティングすることによって、検証した(図37C)。図37Cに示されるように、抗CD7 CARによって誘導された中間プロセスフラトリサイドは、TALL017凍結保存時に依然として活性化された7CAR-Tをもたらした。凍結保存された7CAR-Tは、中間活性化が不十分に解凍された。
図37Bに示されるように、TALL038 CD7 CAR-T細胞を産生するために、健常なドナーから凍結アフェレーシスを受けた。次いで、アフェレーシスを、Plasmatherm(Barkey GmbH&Co.KG)で解凍した。CD4およびCD8T細胞を、CliniMACS Prodigy(Miltenyi Biotec)を使用して、解凍されたアフェレーシスから単離した。2日目に、mRNA塩基エディターおよびガイドRNAを、Lonza SD Nucleofectorを使用して、エレクトロポレーションによりT細胞に送達した。塩基編集後、CD7キメラ抗原受容体(CAR)を、レンチウイルス形質導入を介してT細胞に送達した(7CAR8)。次いで、T細胞を、2~10日目の培養で増殖させた。増殖後、TCRα/β+細胞を枯渇させた。次いで、T細胞を、10~12日目からの培養でさらに増殖させた。次いで、増殖後、回収したCAR-T細胞(>2B)を12日目に凍結保存した。解凍時、TALL038プロセスで、均質な単分散細胞集団を産生した。
実施例23:TALL017およびTALL038 CD7 CAR-T細胞の評価
次世代配列決定(NGS)を使用して、TALL017およびTALL038 CD7 CAR-T細胞における編集効率を比較した。図38に示されるように、両方のタイプのCD7 CAR-T細胞におけるCD52、CD7、TRAC、およびPD-1の編集は、80~99%の効率の範囲であった。対照として、非形質導入(UTD)細胞を使用した。
TALL017およびTALL038 CD7 CAR-T細胞において、解凍後24時間の、TCRα/β、CD52、およびCD7のタンパク質発現を調べた(図39Aおよび39B)。TALL038細胞は、0.4%未満のTCRα/β+細胞を実証した。タンパク質発現データは、TALL017およびTALL038 CD7 CAR-T細胞の両方について、凍結前メトリックおよび解凍後NGSデータと一致した。対照として、非形質導入(UTD)細胞を使用した。
CD7 CAR-T細胞の集団中の細胞の同一性を評価するために、図40に示されるゲーティングスキームを使用した。細胞は、以下の順序でゲーティングされた:FSC/SSC、シングレット、生/死、CD45(すべての白血球)、CD19-(B細胞除外)、CD56-/CD14-(NK/単球除外)、CD2+(T細胞)、およびCD2+のうちのCD4:CD8。図41に示されるように、TALL017およびTALL038 CD7 CAR-T細胞集団の同一性は、CD2+/-細胞とCD56+/-細胞との混合物であった。検出可能な単球またはB細胞はなかった。
最後に、CARの発現を評価した。図42に示されるように、TALL017およびTALL038 CD7 CAR-T細胞集団の両方が、解凍後48時間まで、CAR+細胞発現を維持した。対照として、非形質導入(UTD)細胞を使用した。
また、TALL017およびTALL038 CD7 CAR-T細胞において、CD25およびCD69発現を、解凍後24時間および48時間で評価した。図43に示されるように、解凍後のCD25発現は、TALL017細胞と比較して、TALL038細胞において低かった。CD25は、中期T細胞活性化のマーカーである。ほとんどのCARとは異なり、抗CD7 CARは、培養中フラトリサイドを誘導し、7CARTをさらに活性化する。活性化された状態でTALL017細胞を凍結することは、細胞の健全性(health)に有害であった。TALL038細胞は、TALL017と比較して劇的に低いCD25発現を有し、これは、凍結に対するより高い耐性を示唆し得る。
実施例24:TALL038 CD7 CAR-T細胞のインビトロ特徴付け
TALL038 CD7 CAR-T細胞をインビトロで特徴付けるために、ビーズベースの力価法を開発した(図44)。0日目に、CD7を、ダイナビーズ(Dynabeads)と結合させ、CD7 CAR-T細胞および非形質導入(UTD)細胞を解凍した。1日目に、CD7ビーズを精製し、CD7 CAR-T細胞を共培養し、プレーティングし、37℃でインキュベートした。2日目に、上清を回収し、酵素結合レクチンアッセイ(ELLA)を使用して、読み出しを得た。
このアッセイを使用して、TALL038 CD7 CAR-T細胞を、IFNγ、TNFα、IL-10、およびIL-2放出について評価した。TALL038 CD7 CAR-T細胞は、CD7抗原に応答して、IFNγ、TNFα、およびIL-2を放出した(図45Aおよび45B)。対照として、非形質導入(UTD)細胞を使用した。
TALL038 CD7 CAR-T細胞をインビトロでさらに特徴付けるために、標的腫瘍細胞のCAR指向性T細胞死滅を測定するための共培養方法を開発した。図46は、アッセイの概要を提供する。まず、腫瘍細胞を播種する。次いで、播種した腫瘍細胞に、CAR-T細胞を添加する。次いで、細胞を、IncuCyte(登録商標)スキャニングシステムを使用して分析する。最後に、IncuCyte(登録商標)ソフトウェアを使用して、読み取りを得る。
播種したCCRF-CEMGFP+腫瘍細胞に、TALL038 CD7 CAR-T細胞を添加した。E:T比が、4:1のCAR:CCRF、2:1のCAR:CCRF、または1:1のCAR:CCRFで、表24のT細胞ロットを試験した。
図47Aおよび47Bに示されるように、TALL038 CD7 CAR-T細胞は、TALL017 CAR T細胞と比較して、再付加時にCCRFの増加を示した。
実施例25:TALL038 CD7 CAR-T細胞のインビボでの特徴付け
以前の試験では、CCRFモデルがCD7指向性CAR-T療法に対する応答を示したことが示されている(例えば、Gomes-Silva D.,et al.,CD7-edited T cells expressing a CD7-specific CAR for the therapy of T-cell malignancies.Blood.2017;130:285-296を参照されたい)。
TALL038 CD7 CAR-T細胞をインビボで特徴付けるために、T-ALLのCCRFモデルにおけるインビボ増殖に対するTALL038医薬品の有効性を評価するための試験を開発した。表25は、治験実施計画書を要約したものである。
10匹の6~7週齢の雌NSGマウス(Jackson Labs:ストック005557)を、CCRF-GFP+細胞(1e5)を静脈内(IV)に移植した。11日目に、マウスに、IVを介して250μLの1e7細胞/マウスの総TALL038を移植した。腫瘍負荷を監視するために、注射後2~3週間にわたってIVIS撮像測定を3回/週行った。全血を1回/週に2~3週間収集した。3回/週の体重および移植後の臨床観察を行った。
図48は、CCRF移植後10日目/CD7 CAR-T処置の-1日目(平均、SEM)における生物発光輝度データを示す。この時点で、マウスは、CD7 CAR-T処置に必要な測定可能な腫瘍負荷を示さなかった。図49Aおよび図49Bは、CCRF移植後19日目/7CAR8処置後8日目(平均、SEM)における生物発光輝度データを示す。この時点で、用量依存性腫瘍増殖阻害は、CD7 CAR-T処置に応答して観察された。マウスは、CD7 CAR-T処置に応答して減量しなかった。図50Aおよび50Bは、CCRF移植後38日目/CD7 CAR-T処置後27日目(平均、SEM)における生物発光輝度データを示す。各群の第1のマウスが人道的エンドポイントに到達した日(フラックス>1e10)以降、平均および標準誤差はもはやプロットされなかった。この時点で、再発前の各群において、持続的な用量依存性阻害が観察された。図50Bに、対数スケールを使用することによって、1e7個のCD7 CAR-T群における再発を可視化した。図51A、51B、52A、および52Bに、CCRF移植後38日目/CD7 CAR-T処置後27日目の生物発光輝度データを、個々のマウスについて示す。上記の実験に対して、UTDおよびビヒクルを対照として使用した。
実施例26:T-ALL処置およびリンパ腫単剤療法のためのCD5標的化CAR-T
以前の研究は、複数のがん抗原を標的とすることによって、改善されたCAR-T産物を生成する必要性を認識している(例えば、Xinjie Xu,et al.,Mechanisms of Relapse After CD19 CAR T-Cell Therapy for Acute Lymphoblastic Leukemia and Its Prevention and Treatment Strategies.Front Immunol.2019;10:2664,Nov.12,2019、E.Mejstrikova,et al.,CD19-negative relapse of pediatric B-cell precursor acute lymphoblastic leukemia following blinatumomab treatment.Blood Cancer Journal,7:659(2017)、Hanren Dai,et al.,Bispecific CAR-T cells targeting both CD19 and CD22 for therapy of adults with relapsed or refractory B cell acute lymphoblastic leukemia.J.Hematology&Oncology.13:30(2020)、Robbie G.Majzner and Crystal L.Mackall,Tumor Antigen Escape from CAR T-cell Therapy.Cancer Discov.2018 Oct;8(10):1219-1226を参照されたい)。
CD5の発現は、これらに限定されないが、T-ALL、MF/SS、原発性皮膚T細胞リンパ腫(NOS)、T細胞大顆粒リンパ性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30+LPD、成人T細胞白血病/リンパ腫、およびT細胞前リンパ性白血病を含む、T細胞およびNK細胞悪性腫瘍において特定されている。CD5とCD7を組み合わせると、T-ALL、MF/SS、原発性皮膚T細胞リンパ腫(NOS)、血管免疫芽球性T/NK細胞リンパ腫、および成人T細胞白血病/リンパ腫などの特定のがんに対する液体がん療法の可能性が高まる。
T細胞におけるCD5の発現を低減または排除するために、以下の表26に提供されるように、42個のシチジン塩基エディターのシングルガイドRNA(sgRNA)を生成した(Agilent)。
CD5編集は、フローサイトメトリー、次世代配列決定(NGS)、RNA分析、およびウェスタンブロット分析を使用して、エレクトロポレーションの72時間後、最小のドナー(n=3)および最小の抗体クローン(n=5)に対するガイドをスクリーニングすることによって検証した(図53)。エレクトロポレーションのみ(EP)を陰性対照として使用した。CD5ガイドRNAを用いたシチジン塩基エディターの使用は、T細胞におけるCD5発現を効率的に低減または排除した。
2つの候補ガイドであるsgRNA103(スプライス破壊)およびsgRNA104(終止コドン)を選択し、BE4と組み合わせた場合の、NGSを介した塩基編集効率についてさらに試験した。sgRNA103およびsgRNA104の両方とも、約85%の編集効率を示した。以下の表27は、sgRNA103およびsgRNA104を使用して行われたインシリコOT分析の結果を提供する。
実施例27:CD5標的化CAR-Tの産生
CD5標的化CAR-T細胞を産生するために、レンチウイルスベクター(LVV)を、CD5 CARをコードするように操作した(図55)。患者のT細胞を、CD5 CAR LVVで形質導入した。CAR-T細胞のインビトロでの7~14日間の増殖を、患者の再注入の前に行った。図55は、例示的なCD5 CAR構築物の設計を示す。例示的なCD5 CAR構築物の設計は、抗CD5 scFv、ヒンジ/スペーサー、膜貫通ドメイン、シグナル2共刺激ドメイン、およびCD3ζ共刺激ドメインを含む。ヒンジ/スペーサー領域は、CH3、CD8α、またはCD28を含み得る。膜貫通ドメインは、CD8αまたはCD28を含み得る。共刺激ドメインは、41bbまたはCD28を含み得る。
30個のLVVが生成された。以下の表28は、様々なLVV CD5 CAR構築物を提供する。
MNDプロモーターまたはPGKプロモーターのいずれかを有する表27のCD5 CAR LVV構築物の各々をスクリーニングして、sgRNA103およびsgRNA104のいずれかを使用して、初代ヒトT細胞におけるCAR発現を調べた。対照として、非形質導入(UTD)細胞を使用した。図56に示されるように、CD5 CAR LVV構築物は、0%~82%の範囲のCAR発現を有する結果となった。24種類の構築物は、10日間の培養期間の終了時に、T細胞の表面上で検出可能なCAR発現を示した。
ヒンジ/スペーサーCAR構築物配列がCAR発現に影響を及ぼすかどうかを決定するために、異なるヒンジ/スペーサー配列(太字)を含む表29のCAR構築物を、sgRNA103およびsgRNA104のいずれかと組み合わせて調べた。対照として、非形質導入(UTD)細胞を使用した。図57に示されるように、ヒンジ/スペーサー配列は、CAR発現に影響を及ぼした。
インビトロでCD5 LVV CAR-T細胞をさらに特徴付けるために、ライブイメージング死滅アッセイを行った。CD5 LVV CAR-T細胞(LV66、LV67、LV68、およびLV69)をCCRF腫瘍細胞に添加した。図57A~57Dに示されるように、編集および未編集の構築物は、CD5+CCRF細胞に対して細胞傷害性であった。
CD5 CAR構築物(LV63~LV69)を、T細胞単独またはCCRF細胞で、sgRNA103およびsgRNA104のいずれかを使用して、IFNγ産生についてインビトロで評価した(図59Aおよび59B)。すべてのCD5 CAR構築物は、CD5+CCRF-CEM白血病細胞株の存在下でIFNγを放出した。
実施例28:複数の修飾免疫エフェクター細胞を使用した併用療法
複数の遺伝子修飾CAR-T細胞の使用により、T細胞またはNK細胞悪性腫瘍(例えば、液体がん)を有する患者の治療を増強することができるかどうかを調べるために、患者に、それらの免疫表現型に基づいて、1つ以上の修飾CAR-T細胞を投与した。患者試料からの免疫細胞を、フローサイトメトリーおよび/または配列解析を使用して、CD5、CD7、CD33、およびCD123の存在または不在について免疫表現型を決定した。mRNA塩基エディターおよびガイドRNAを、エレクトロポレーションによって免疫細胞に送達して、CD5、CD7、CD33、またはCD123のいずれかを、TRAC、LAG-3、FAS、CD52、B2M、CIITA、TRBC1、TRBC2、およびPD-1のうちの1つ以上と組み合わせて編集して、免疫細胞におけるこれらの遺伝子の発現を低減および/または排除した。塩基編集後、CD5 CAR、CD7 CAR、CD33 CAR、またはCD123 CARを、レンチウイルス形質導入を介して修飾免疫細胞に送達して、それぞれ、CD5、CD7、CD33、およびCD123 CAR-T細胞を作製した。
CD5CD7として免疫表現型が決定された患者を、CD5 CAR-T細胞またはその集団を用いて処置した。CD5CD7として免疫表現型が決定された患者を、CD7 CAR-T細胞またはその集団を用いて処置した。CD5CD7として免疫表現型が決定された患者を、CD5 CAR-T細胞またはその集団、および/またはCD7 CAR-T細胞またはその集団を用いて処置した。CD33-CD123+として免疫表現型が決定された患者を、CD123 CAR-T細胞またはその集団を用いて処置した。CD33+CD123-として免疫表現型が決定された患者を、CD33 CAR-T細胞またはその集団を用いて処置した。CD33+ CD123+として免疫表現型が決定された患者を、CD33 CAR-T細胞またはその集団、および/またはCD123 CAR-T細胞またはその集団を用いて処置した。CD5+CD7+CD33+CD123+として免疫表現型が決定された患者を、CD33 CAR-T細胞またはその集団、CD5 CAR-T細胞またはその集団、CD7 CAR-T細胞またはその集団、および/またはCD123 CAR-T細胞またはその集団の任意の組み合わせを用いて治療した。
本開示は以下の実施形態を含む。
実施形態1
組成物であって、2つ以上の免疫細胞を含み、各免疫細胞が、
a)CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする異なるキメラ抗原受容体であって、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する変異を含む、異なるキメラ抗原受容体と、
b)TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される免疫原性ポリペプチドの発現を低減または排除する1つ以上の変異と、を含む、組成物。
実施形態2
前記免疫細胞のうちの1つが、CD5を標的とするキメラ抗原受容体を含み、別の免疫細胞が、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を含む、実施形態1に記載の組成物。
実施形態3
前記組成物が、少なくとも3つの免疫細胞を含み、各々が、異なる抗原を標的とするキメラ抗原受容体を含み、前記標的とされた抗原が、CD3、CD5、およびCD7である、実施形態2に記載の組成物。
実施形態4
前記免疫細胞のうちの1つが、CD7を標的とするキメラ抗原受容体を発現し、別の免疫細胞が、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を発現する、実施形態1に記載の組成物。
実施形態5
前記免疫細胞のうちの1つが、CD3を標的とするキメラ抗原受容体を発現し、別の免疫細胞が、CD33およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体を発現する、実施形態1に記載の組成物。
実施形態6
前記免疫細胞のうちの1つが、CD33を標的とするキメラ抗原受容体を発現し、別の免疫細胞が、CD123を標的とするキメラ抗原受容体を発現する、実施形態1に記載の組成物。
実施形態7
1つの免疫細胞が、2、3、4個、またはそれ以上の異なるキメラ抗原受容体を発現する、実施形態1~6のいずれか一項に記載の組成物。
実施形態8
前記キメラ抗原受容体のうちの1つが、CD5を標的とし、別のキメラ抗原受容体が、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする、実施形態7に記載の組成物。
実施形態9
前記キメラ抗原受容体のうちの1つが、CD7を標的とし、別のキメラ抗原受容体が、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする、実施形態7に記載の組成物。
実施形態10
前記キメラ抗原受容体のうちの1つが、CD3を標的とし、別のキメラ抗原受容体が、CD33およびCD123からなる群から選択される抗原を標的とする、実施形態7に記載の組成物。
実施形態11
前記キメラ抗原受容体のうちの1つが、CD33を標的とし、別のキメラ抗原受容体が、CD123を標的とする、実施形態7に記載の組成物。
実施形態12
少なくとも3つの免疫細胞を含む組成物であって、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体が、CD3を標的とし、1つが、CD5を標的とし、3つ目が、CD7を標的とし、前記細胞が、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、組成物。
実施形態13
少なくとも2つの免疫細胞を含む組成物であって、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体が、CD3を標的とし、別の受容体が、CD7を標的とし、前記細胞が、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、組成物。
実施形態14
少なくとも2つの免疫細胞を含む組成物であって、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体が、CD5を標的とし、別の受容体が、CD7を標的とし、前記細胞が、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、組成物。
実施形態15
少なくとも2つの免疫細胞を含む組成物であって、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体が、CD3を標的とし、別の受容体が、CD5を標的とし、前記細胞が、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、組成物。
実施形態16
少なくとも2つの免疫細胞を含む組成物であって、各々が、異なるキメラ抗原受容体を含み、1つのキメラ抗原受容体が、CD33を標的とし、別の受容体が、CD123を標的とし、前記細胞が、標的とされた抗原の発現を低減または排除する変異をさらに含み、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、組成物。
実施形態17
前記変異が、遺伝子をサイレンシングするか、または前記遺伝子に終止コドンを導入する、CからTまたはAからGの変異である、実施形態1~16のいずれか一項に記載の組成物。
実施形態18
前記変異が、未熟終止コドンを導入するか、またはスプライスドナー部位もしくはスプライスアクセプター部位を改変する、実施形態1~17のいずれか一項に記載の組成物。
実施形態19
前記変異が、デアミナーゼドメインを含む塩基エディターによって生成される、実施形態18に記載の組成物。
実施形態20
前記デアミナーゼが、シチジンまたはアデノシンデアミナーゼである、実施形態19に記載の組成物。
実施形態21
前記塩基エディターが、BE4である、実施形態20に記載の組成物。
実施形態22
前記変異が、前記変異を欠く対応する対照細胞と比較して、コードされたポリペプチドの発現を約50%以上低減する、実施形態1~21のいずれか一項に記載の組成物。
実施形態23
前記組成物が、免疫細胞の集団を含む、実施形態1~22のいずれか一項に記載の組成物。
実施形態24
前記集団の少なくとも50%が、前記標的とされた抗原および/または前記免疫原性ポリペプチドの発現を低減または排除する1つ以上の変異を含む、実施形態23に記載の組成物。
実施形態25
前記免疫細胞が、フラトリサイド(fratricide)耐性である、実施形態1~24のいずれか一項に記載の組成物。
実施形態26
前記免疫細胞が、増加した抗腫瘍活性を有する、実施形態1~25のいずれか一項に記載の組成物。
実施形態27
前記免疫細胞が、検出可能な転座を含まない、実施形態1~26のいずれか一項に記載の組成物。
実施形態28
前記免疫細胞が、1%未満のインデルを含む、実施形態1~27のいずれか一項に記載の組成物。
実施形態29
前記免疫細胞が、哺乳動物細胞である、実施形態1~28のいずれか一項に記載の組成物。
実施形態30
前記哺乳動物細胞が、ヒト細胞またはげっ歯類細胞である、実施形態29に記載の組成物。
実施形態31
前記免疫細胞が、細胞傷害性T細胞、制御性T細胞、Tヘルパー細胞、樹状細胞、B細胞、もしくはNK細胞、またはそれらの前駆細胞である、実施形態1~30のいずれか一項に記載の組成物。
実施形態32
前記前駆細胞が、造血幹細胞である、実施形態31に記載の組成物。
実施形態33
有効量の、実施形態1~32のいずれか一項に記載の組成物と、薬学的に許容される賦形剤と、を含む、薬学的組成物。
実施形態34
核酸プログラマブルDNA結合タンパク質(napDNAbp)およびデアミナーゼドメインを含む融合タンパク質と、各々異なる抗原を標的とする少なくとも2つのガイドポリヌクレオチドと、を含み、前記抗原が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される、塩基エディターシステム。
実施形態35
1つのガイドポリヌクレオチドが、CD5を標的とし、別のガイドポリヌクレオチドが、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする、実施形態34に記載の塩基エディターシステム。
実施形態36
前記システムが、3つのガイドポリヌクレオチドを含み、各々が、抗原CD3、CD5、およびCD7のうちの1つを標的とする、実施形態34に記載の塩基エディターシステム。
実施形態37
1つのガイドポリヌクレオチドが、CD7を標的とし、別のガイドポリヌクレオチドが、CD3、CD33、およびCD123からなる群から選択される抗原を標的とする、実施形態34に記載の塩基エディターシステム。
実施形態38
1つのガイドポリヌクレオチドが、CD3を標的とし、別のガイドポリヌクレオチドが、CD33およびCD123からなる群から選択される抗原を標的とする、実施形態34に記載の塩基エディターシステム。
実施形態39
1つのガイドポリヌクレオチドが、CD33を標的とし、別のガイドポリヌクレオチドが、CD123を標的とする、実施形態34に記載の塩基エディターシステム。
実施形態40
前記ガイドポリヌクレオチドが、各々、表26から選択される核酸配列を含む、実施形態34に記載の塩基エディターシステム。
実施形態41
前記ガイドポリヌクレオチドが、AGCGACUGCAGAAAGAAGAGまたはCAUACCAGCUGAGCCGUCCGから選択される核酸配列を含む、実施形態40に記載の塩基エディターシステム。
実施形態42
前記融合タンパク質が、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)および/または1つ以上の核局在化配列(NLS)をさらに含む、実施形態34~41のいずれか一項に記載の塩基エディターシステム。
実施形態43
前記napDNAbpが、Cas9、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦポリペプチド、またはその一部を含む、実施形態34~42のいずれか一項に記載の塩基エディターシステム。
実施形態44
前記napDNAbpが、Cas12ポリペプチドまたはその断片を含む、実施形態43に記載の塩基エディターシステム。
実施形態45
前記napDNAbpが、Cas9ポリペプチドまたはその断片を含む、実施形態43に記載の塩基エディターシステム。
実施形態46
前記Cas9が、不活性型(dead)Cas9(dCas9)またはCas9ニッカーゼ(nCas9)である、実施形態45に記載の塩基エディターシステム。
実施形態47
前記Cas9が、修飾Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、または修飾Streptococcus pyogenes Cas9(SpCas9)である、実施形態45に記載の塩基エディターシステム。
実施形態48
前記Cas9が、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を含む、実施形態45に記載の塩基エディターシステム。
実施形態49
前記改変されたPAMが、前記核酸配列5’-NGC-3’に対する特異性を有する、実施形態48に記載の塩基エディターシステム。
実施形態50
前記デアミナーゼドメインが、シチジンまたはアデノシンを脱アミノ化することができる、実施形態34~49のいずれか一項に記載の塩基エディターシステム。
実施形態51
前記デアミナーゼドメインが、シチジンまたはアデノシンデアミナーゼドメインである、実施形態50に記載の塩基エディターシステム。
実施形態52
前記シチジンデアミナーゼが、APOBECデアミナーゼである、実施形態51に記載の塩基エディターシステム。
実施形態53
前記アデノシンデアミナーゼが、TadAバリアントである、実施形態51に記載の塩基エディターシステム。
実施形態54
前記TadAバリアントが、TadA*8バリアントである、実施形態51に記載の塩基エディターシステム。
実施形態55
前記TadA*8バリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、実施形態54に記載の塩基エディターシステム。
実施形態56
前記TadAバリアントが、TadA*9バリアントである、実施形態53に記載の塩基エディターシステム。
実施形態57
実施形態34~56のいずれか一項に記載の塩基エディターシステムを含む、薬学的組成物。
実施形態58
実施形態34~56のいずれか一項に記載の塩基エディターシステムおよびガイドポリヌクレオチドをコードする、ポリヌクレオチド。
実施形態59
実施形態58に記載のポリヌクレオチドを含む、ベクター。
実施形態60
前記ベクターが、ウイルスベクターである、実施形態59に記載のベクター。
実施形態61
前記ウイルスベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、実施形態60に記載のベクター。
実施形態62
実施形態58に記載のポリヌクレオチド、または実施形態59~61のいずれか一項に記載のベクターを含む、薬学的組成物。
実施形態63
低減された免疫原性を有するCAR発現免疫細胞を産生するための方法であって、CAR発現免疫細胞において、核酸プログラマブルDNA結合タンパク質(napDNAbp)およびデアミナーゼドメインを含む融合タンパク質と、各々異なる抗原をコードするポリヌクレオチドを標的とする2つのガイドポリヌクレオチドと、を含む塩基エディターシステムを発現させることを含み、前記抗原が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、それによって、低減された免疫原性を有するCAR発現免疫細胞を産生する、方法。
実施形態64
前記免疫細胞が、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドをコードするポリヌクレオチドを標的とするガイドポリヌクレオチドを発現するか、またはそれと接触する、実施形態63に記載の方法。
実施形態65
低減された免疫原性を有するCAR発現免疫細胞を産生するための方法であって、
(a)CAR発現免疫細胞において、核酸プログラマブルDNA結合タンパク質(napDNAbp)およびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターシステムを発現させることと、
(b)前記CAR発現免疫細胞を、各々異なる抗原をコードするポリヌクレオチドを標的とする少なくとも2つのガイドポリヌクレオチドと接触させることであって、前記抗原が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、それによって、低減された免疫原性を有するCAR発現免疫細胞を産生する、接触させることと、を含む、方法。
実施形態66
前記CAR発現免疫細胞を、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドをコードするポリヌクレオチドを標的とするガイドポリヌクレオチドと接触させることをさらに含む、実施形態65に記載の方法。
実施形態67
前記免疫細胞が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を標的とするキメラ抗原受容体(CAR)を発現する、実施形態63または64に記載の方法。
実施形態68
前記免疫細胞に、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される少なくとも1つのポリペプチドの発現を低減または排除する変異を導入し、それによって、低減された免疫原性を有するCAR発現免疫細胞の集団を産生することをさらに含む、実施形態63または64に記載の方法。
実施形態69
低減された免疫原性を有するCAR発現免疫細胞の集団を産生するための方法であって、
a)1つの免疫細胞に、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原の発現を低減または排除する変異を導入し、第2の免疫細胞に、前記抗原のうちの1つにおける異なる変異を導入することと、
b)前記免疫細胞に、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される少なくとも1つのポリペプチドの発現を低減または排除する変異を導入し、それによって、低減された免疫原性を有するCAR発現免疫細胞の集団を産生することと、を含む、方法。
実施形態70
前記免疫細胞によって発現された前記キメラ抗原受容体が、CD3、CD5、CD7、CD33、およびCD123からなる群から選択される抗原を標的とする、実施形態69に記載の方法。
実施形態71
前記方法によって産生された免疫細胞が、CD3、CD5、および/またはCD7抗原を標的とするキメラ抗原受容体を発現し、CD3、CD5、および/もしくはCD7抗原を発現できないか、または減少したレベルのCD3、CD5、および/もしくはCD7抗原を発現する、実施形態65~68のいずれか一項に記載の方法。
実施形態72
前記方法によって産生された免疫細胞が、CD33およびCD123抗原を標的とするキメラ抗原受容体を発現し、CD33およびCD123抗原を発現できないか、または減少したレベルのCD33およびCD123抗原を発現する、実施形態65~68のいずれか一項に記載の方法。
実施形態73
前記CARが、CD5キメラ抗原受容体(CAR)である、実施形態71に記載の方法。
実施形態74
前記CD5 CARが、表28に提示されるCD5 CAR構築物によってコードされる、実施形態73に記載の方法。
実施形態75
低減された免疫原性を有する免疫細胞を産生するための方法であって、
a)CD5の発現を低減または排除する内因性CD5遺伝子配列または調節エレメントに、変異を導入することと、
b)前記細胞において、表28に提示されるCD5 CAR構築物を発現させることと、を含む、方法。
実施形態76
前記CD5 CAR構築物が、以下から選択されるアミノ酸配列を含むか、またはそれからなるCD5 CARポリペプチドをコードする、実施形態74または75に記載の方法:
a)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKFWVLVVVGGVLACYSLLVTVAFIIFWV 420
421 RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQ 480
481 LYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGE 540
541 RRRGKGHDGLYQGLSTATKDTYDALHMQALPPR 573;
b)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
301 AGGAVHTRGLDFACDFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPR 360
361 RPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDK 420
421 RRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTAT 480
481 KDTYDALHMQALPPR 495;
c)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAIEVMYPPPYLDNEKSNGTIIHVKGKHLCPS 300
301 PLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTR 360
361 KHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDP 420
421 EMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDA 480
481 LHMQALPPR 489;
d)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKPTTTPAPRPPTPAPTIASQPLSLRPEA 420
421 CRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMR 480
481 PVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVL 540
541 DKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLST 600
601 ATKDTYDALHMQALPPR 617; または
e)
1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
301 AGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQT 360
361 TQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRR 420
421 DPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD 480
481 DALHMQALPPRX 494。
実施形態77
前記方法によって産生された前記免疫細胞が、対応する対照細胞と比較して、フラトリサイド耐性および/または増加した抗腫瘍活性を示す、実施形態63~76のいずれか一項に記載の方法。
実施形態78
前記方法が、インビボまたはエクスビボで実施される、実施形態63~76のいずれか一項に記載の方法。
実施形態79
前記方法によって産生された前記免疫細胞が、検出可能な転座を含まない、実施形態63~76のいずれか一項に記載の方法。
実施形態80
前記方法によって産生された前記免疫細胞が、1%未満のインデルを含む、実施形態63~76のいずれか一項に記載の方法。
実施形態81
前記方法によって産生された前記免疫細胞が、5%未満の非標的編集を含む、実施形態63~76のいずれか一項に記載の方法。
実施形態82
前記方法によって産生された前記免疫細胞が、5%未満のオフターゲット編集を含む、実施形態63~76のいずれか一項に記載の方法。
実施形態83
前記変異が、核酸塩基修飾によって生成される、実施形態63~76のいずれか一項に記載の方法。
実施形態84
前記変異が、エキソン内にある、実施形態83に記載の方法。
実施形態85
前記変異が、タンパク質発現を低減または排除する未熟終止コドンをもたらす、実施形態83または84に記載の方法。
実施形態86
前記変異が、スプライスドナー部位またはスプライスアクセプター部位にある、実施形態83または84に記載の方法。
実施形態87
1つ以上の変異が、標的ポリヌクレオチドを、核酸プログラマブルDNA結合タンパク質(napDNAbp)、デアミナーゼ、および1つ以上のガイドポリヌクレオチドを含む融合タンパク質を含む塩基エディターシステムと接触させることによって生成される、実施形態63~76のいずれか一項に記載の方法。
実施形態88
前記デアミナーゼが、アデノシンデアミナーゼまたはシチジンデアミナーゼである、実施形態87に記載の方法。
実施形態89
前記シチジンデアミナーゼが、BE4である、実施形態88に記載の方法。
実施形態90
前記変異が、前記変異を欠く対応する対照細胞と比較して、コードされたポリペプチドの発現を少なくとも約50%以上低減する、実施形態87に記載の方法。
実施形態91
前記ガイドポリヌクレオチドが、表26に提供される配列から選択される配列を含む、実施形態87に記載の方法。
実施形態92
前記ガイドポリヌクレオチドが、AGCGACUGCAGAAAGAAGAGまたはCAUACCAGCUGAGCCGUCCGから選択される核酸配列を含む、実施形態91に記載の方法。
実施形態93
前記1つ以上のガイド核酸配列の各々が、前記napDNAbpを、CD5、FAS、LAG-3、CD52、TRAC、B2M、CIITA、TRBC1、TRBC2、および/またはPDC1/PD-1遺伝子もしくは調節エレメントに標的指向化する、実施形態87に記載の方法。
実施形態94
前記塩基エディターおよび1つ以上のガイド核酸配列が、エレクトロポレーション、ヌクレオフェクション、カチオン性脂質媒介方法、ウイルス形質導入、またはそれらの組み合わせを介して、前記免疫細胞に導入される、実施形態87に記載の方法。
実施形態95
培養中の前記免疫細胞を増殖させて、免疫細胞の集団を生成することをさらに含む、実施形態63~94のいずれか一項に記載の方法。
実施形態96
前記抗原またはポリペプチドの発現が、前記免疫細胞の集団の少なくとも約50%において低減する、実施形態95に記載の方法。
実施形態97
前記修飾免疫細胞の集団からTCRα/β+細胞を枯渇させることをさらに含む、実施形態95に記載の方法。
実施形態98
実施形態63~97のいずれか一項に記載の方法によって産生された、低減された免疫原性を有する、CAR発現免疫細胞。
実施形態99
実施形態98に記載の免疫細胞を含む、薬学的組成物。
実施形態100
薬学的に許容される賦形剤をさらに含む、実施形態99に記載の薬学的組成物。
実施形態101
腫瘍細胞を死滅させる方法であって、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍細胞を、2つ以上の免疫細胞と接触させることを含み、各免疫細胞が、前記細胞によって発現された前記抗原のうちの2つを標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む、方法。
実施形態102
前記方法が、インビトロまたはインビボで実施される、実施形態101に記載の方法。
実施形態103
前記腫瘍細胞が、腫瘍に由来する、実施形態101に記載の方法。
実施形態104
対象における腫瘍を治療するための方法であって、前記対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される前記対象の腫瘍細胞によって発現された抗原を標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記抗原の発現を低減または排除する1つ以上の変異を含み、前記免疫細胞の各々が、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含む、方法。
実施形態105
前記腫瘍が、血液がんである、実施形態103または104に記載の方法。
実施形態106
前記腫瘍が、液体がんである、実施形態105に記載の方法。
実施形態107
前記血液がんが、白血病、骨髄腫、および/またはリンパ腫である、実施形態105に記載の方法。
実施形態108
前記血液がんが、B細胞がんである、実施形態107に記載の方法。
実施形態109
前記血液がんが、以下のT細胞急性リンパ芽球性白血病(T-ALL)、菌状息肉症(MF)、セザリー症候群(SS)、末梢性T/NK細胞リンパ腫、未分化大細胞リンパ腫ALK 、原発性皮膚T細胞リンパ腫、T細胞大顆粒リンパ球性白血病、血管免疫芽球性T/NK細胞リンパ腫、肝脾T細胞リンパ腫、原発性皮膚CD30 リンパ増殖性障害、節外性NK/T細胞リンパ腫、成人T細胞白血病/リンパ腫、T細胞前リンパ球性白血病、皮下脂肪織炎様T細胞リンパ腫、原発性皮膚γδT細胞リンパ腫、アグレッシブNK細胞白血病、および腸症関連T細胞リンパ腫のうちの少なくとも1つから選択される、実施形態105に記載の方法。
実施形態110
前記血液がんが、T細胞急性リンパ芽球性白血病(T-ALL)細胞である、実施形態109に記載の方法。
実施形態111
前記血液がんが、急性骨髄性白血病(AML)である、実施形態109に記載の方法。
実施形態112
選択された対象における腫瘍を治療するための方法であって、前記選択された対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞が、前記対象の腫瘍細胞によって発現された抗原を標的とする異なるキメラ抗原受容体を発現し、前記抗原が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択され、前記免疫細胞が、前記抗原の発現を低減または排除する1つ以上の変異を含み、前記免疫細胞の各々が、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異をさらに含み、前記対象が、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍を有するものとして選択される、方法。
実施形態113
前記血液がんが、T細胞急性リンパ芽球性白血病(T-ALL)細胞である、実施形態109に記載の方法。
実施形態114
前記血液がんが、急性骨髄性白血病(AML)である、実施形態109に記載の方法。
実施形態115
異なるキメラ抗原受容体を発現する前記2つ以上の免疫細胞が、順次投与される、実施形態101~112のいずれか一項に記載の方法。
実施形態116
異なるキメラ抗原受容体を発現する前記2つ以上の免疫細胞が、同時に投与される、実施形態101~112のいずれか一項に記載の方法。
実施形態117
対象における腫瘍細胞の抗原依存性死滅のための方法であって、CD5、CD7、CD3、CD33、およびCD123からなる群から選択される抗原を発現する腫瘍を有する対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞が、前記抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む、方法。
実施形態118
対象における急性骨髄性白血病(AML)細胞の抗原依存性死滅のための方法であって、AML発現CD33およびCD123抗原を有する対象に、2つ以上の免疫細胞を投与することを含み、各免疫細胞が、前記抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む、方法。
実施形態119
対象におけるT細胞急性リンパ芽球性白血病(T-ALL)細胞の抗原依存性死滅のための方法であって、T-ALL発現CD3、CD5、およびCD7抗原を有する対象に、少なくとも3つの免疫細胞を投与することを含み、各免疫細胞が、前記抗原のうちの1つを標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含む、方法。
実施形態120
選択された対象におけるがんを治療するための方法であって、前記対象に少なくとも2つの免疫細胞を投与することを含み、各免疫細胞が、CD33またはCD123抗原を標的とするキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含み、前記対象が、前記がんをCD33およびCD123抗原を発現しているものとして特徴付けることによって、選択される、方法。
実施形態121
前記CD33およびCD123抗原を発現しているがんが、AMLである、実施形態120に記載の方法。
実施形態122
選択された対象におけるがんを治療するための方法であって、前記対象に、3つ以上の免疫細胞を投与することを含み、各免疫細胞が、CD3、CD5、およびCD7抗原を標的とする異なるキメラ抗原受容体を発現し、前記免疫細胞が、前記標的とされた抗原の発現を低減または排除する1つ以上の変異、ならびにTRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択されるポリペプチドの発現を低減または排除する1つ以上の変異を含み、前記対象が、前記がんをCD3、CD5、およびCD7抗原を発現しているものとして特徴付けることによって、選択される、方法。
実施形態123
前記CD3、CD5、およびCD7抗原を発現するがんが、T-ALLである、実施形態122に記載の方法。
実施形態124
前記免疫細胞が、細胞傷害性T細胞、制御性T細胞、Tヘルパー細胞、樹状細胞、B細胞、またはNK細胞である、実施形態101~123のいずれか一項に記載の方法。
実施形態125
前記対象が、以前にリンパ枯渇により治療されたことがある、実施形態101~123のいずれか一項に記載の方法。
実施形態126
前記リンパ枯渇が、シクロホスファミド、フルダラビン、および/またはアレムツズマブ(Cy/Flu/Campath)の投与を伴う、実施形態125に記載の方法。
実施形態127
前記対象が、化学療法に対して不応性であるか、または高い腫瘍負荷を有する、実施形態101~126のいずれか一項に記載の方法。
実施形態128
前記対象が、その後、同種造血幹細胞移植(allo-HSCT)により治療される、実施形態101~127のいずれか一項に記載の方法。
実施形態129
前記免疫細胞が、単一のヒトドナーに由来する、実施形態1~32のいずれか一項に記載の組成物、または実施形態63~97もしくは101~111のいずれか一項に記載の方法。
実施形態130
前記免疫細胞が、前記対象に対して自己由来である、実施形態101~121のいずれか一項に記載の方法。
実施形態131
前記免疫細胞が、前記対象に対して同種である、実施形態101~121のいずれか一項に記載の方法。
実施形態132
前記対象が、哺乳動物対象である、実施形態101~121のいずれか一項に記載の方法。
実施形態133
前記対象が、ヒト対象またはげっ歯類対象である、実施形態101~121のいずれか一項に記載の方法。
実施形態134
前記対象が、小児ヒト対象である、実施形態101~121のいずれか一項に記載の方法。
実施形態135
前記がんの治療に使用するための、実施形態1~32のいずれか一項に記載の組成物を含む、キット。
実施形態136
低減された免疫原性を有するCAR発現免疫細胞の生成に使用するための、実施形態34~56のいずれか一項に記載の塩基エディターシステムを含む、キット。
実施形態137
前記キットの使用に関する書面による説明書をさらに含む、実施形態135または136に記載のキット。
他の実施形態
前述の説明から、本明細書に記載の発明に変形および修正を加えて、それを様々な用法および条件に採用することができることは明らかであろう。かかる実施形態もまた、以下の特許請求の範囲の範囲内である。
本明細書における変数の任意の定義における要素のリストの列挙は、任意の単一の要素として、または列挙された要素の組み合わせ(またはサブコンビネーション)として、その変数の定義を含む。本明細書における実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。
本明細書で言及されるすべての刊行物、特許、および特許出願は、あたかも各個々の刊行物、特許、または特許出願が参照により援用されることが具体的かつ個別に示されるのと同じ程度に、参照により本明細書に援用される。別段の指示がない場合、本明細書に記載されている刊行物、特許、および特許出願は、それらの全体が参照により本明細書に援用される。

Claims (19)

  1. 低減された免疫原性を有するCAR発現免疫細胞またはCAR発現免疫細胞の集団を産生するためのエクスビボの方法であって、
    a)免疫細胞または免疫細胞の集団中の標的ポリヌクレオチドを、ガイドポリヌクレオチド、および核酸プログラマブルDNA結合タンパク質(napDNAbp)とTadA*8デアミナーゼドメインとを含む融合タンパク質を含む塩基エディターに、または、ガイドポリヌクレオチドと核酸プログラマブルDNA結合タンパク質(napDNAbp)とTadA*8デアミナーゼドメインとを含む塩基エディターシステムに接触させることと、
    b)CD3、CD5、CD7、CD33、およびCD123からなる群から選択される抗原の発現を低減または排除する変異を核酸塩基修飾により導入することと、
    )前記免疫細胞に、CD3e、TRAC、LAG-3、FAS、CIITA、TRBC1、TRBC2、CD52、B2M、およびPD1からなる群から選択される少なくとも1つのポリペプチドの発現を低減または排除する変異を核酸塩基修飾により導入することと、
    d)CD3、CD5、CD7、CD33、またはCD123抗原を標的とするキメラ抗原受容体を前記免疫細胞または免疫細胞の集団において発現させ、それによって、低減された免疫原性を有するCAR発現免疫細胞またはCAR発現免疫細胞の集団を産生することと、を含む、方法。
  2. 前記CARが、CD5キメラ抗原受容体(CAR)である、請求項に記載の方法。
  3. 前記CD5 CARが、以下から選択されるアミノ酸配列を含むまたはそれからなる、請求項2に記載の方法:
    a)
    1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
    61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
    121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
    181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
    241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
    301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
    361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKFWVLVVVGGVLACYSLLVTVAFIIFWV 420
    421 RSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQ 480
    481 LYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGE 540
    541 RRRGKGHDGLYQGLSTATKDTYDALHMQALPPR 573;
    b)
    1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
    61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
    121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
    181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
    241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
    301 AGGAVHTRGLDFACDFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPR 360
    361 RPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDK 420
    421 RRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTAT 480
    481 KDTYDALHMQALPPR 495;
    c)
    1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
    61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
    121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
    181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
    241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAIEVMYPPPYLDNEKSNGTIIHVKGKHLCPS 300
    301 PLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTR 360
    361 KHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDP 420
    421 EMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDA 480
    481 LHMQALPPR 489;
    d)
    1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
    61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
    121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
    181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
    241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPAEPKSPDKTHTCPGQPREPQVYTLPPSRDEL 300
    301 TKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQ 360
    361 QGNVFSCSVMHEALHNHYTQKSLSLSPGKKDPKPTTTPAPRPPTPAPTIASQPLSLRPEA 420
    421 CRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMR 480
    481 PVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVL 540
    541 DKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLST 600
    601 ATKDTYDALHMQALPPR 617; または
    e)
    1 MEFGLSWLFLVAILKGVQCIDAMGNIQLVQSGPELKKPGETVKISCKASGYTFTNYGMNW 60
    61 VKQAPGKGLRWMGWINTHTGEPTYADDFKGRFAFSLETSASTAYLQINNLKNEDTATYFC 120
    121 TRRGYDWYFDVWGAGTTVTVSSGGGGSGGGGSGGGGSDIKMTQSPSSMYASLGERVTITC 180
    181 KASQDINSYLSWFHHKPGKSPKTLIYRANRLVDGVPSRFSGSGSGQDYSLTISSLDYEDM 240
    241 GIYYCQQYDESPWTFGGGTKLEMKGSGDPATTTPAPRPPTPAPTIASQPLSLRPEACRPA 300
    301 AGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQT 360
    361 TQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRR 420
    421 DPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD 480
    481 DALHMQALPPRX 494
  4. 前記方法によって産生された前記免疫細胞が、対応する対照細胞と比較して、フラトリサイド耐性および/または増加した抗腫瘍活性を示す、請求項1~3のいずれか一項に記載の方法。
  5. 前記方法によって産生された前記免疫細胞が、検出可能な転座を含まない、請求項1~4のいずれか一項に記載の方法。
  6. 前記方法によって産生された前記免疫細胞が、1%未満のインデルを含む、請求項1~5のいずれか一項に記載の方法。
  7. 前記方法によって産生された前記免疫細胞が、5%未満の非標的編集を含む、請求項1~6のいずれか一項に記載の方法。
  8. 前記変異が、エキソン内、スプライスドナー部位、またはスプライスアクセプター部位にある、請求項1~7のいずれか一項に記載の方法。
  9. 前記変異が、タンパク質発現を低減または排除する未熟終止コドンをもたらす、請求項に記載の方法。
  10. 前記変異が、前記変異を欠く対応する対照細胞と比較して、コードされたポリペプチドの発現を少なくとも約50%以上低減する、請求項1~9のいずれか一項に記載の方法。
  11. 前記ガイドポリヌクレオチドが、CUCUUACCUGUACCAUAACC、CCUACCUGUCACCAGGACCA、およびCACCUACCUAAGAACCAUCCから選択される核酸配列を含む、請求項1~10のいずれか一項に記載の方法。
  12. 前記1つ以上のガイド核酸配列の各々が、前記napDNAbpを、CD3e、CD5、FAS、LAG-3、CD52、TRAC、B2M、CIITA、TRBC1、TRBC2、および/またはPDC1/PD-1遺伝子もしくは調節エレメントに標的指向化する、請求項1~9のいずれか一項に記載の方法。
  13. 前記塩基エディターおよび1つ以上のガイド核酸配列が、エレクトロポレーション、ヌクレオフェクション、カチオン性脂質媒介方法、ウイルス形質導入、またはそれらの組み合わせを介して、前記免疫細胞に導入される、請求項1~9のいずれか一項に記載の方法。
  14. 前記修飾された免疫細胞の集団からTCRα/β+細胞を枯渇させることをさらに含む、請求項1~13のいずれか一項に記載の方法。
  15. 前記デアミナーゼは、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項1~14のいずれか一項に記載の方法。
  16. CD7 CARが、以下のアミノ酸配列を含むまたはそれからなる、請求項1~15のいずれか一項に記載の方法:
    7CAR8
    1 MALPVTALLLPLALLLHAARPGSDIELTQSPAIMSASLGEEITLTCSASSSVSYMHWYQQ 60
    61 KSGTSPKLLIYSTSNLASGVPSRFSGSGSGTFYSLTISSVEAEDAADYYCHQWSSYTFGG 120
    121 GTKLEIKRGGGGSGGGGSGGGGSQVKLQESGGGLVKPGGSLKLSCAASGFTFSSYAMSWV 180
    181 RQTPEKRLEWVATISSGGSYTYYPDSVKGRFTISRDNAKNTLYLQMSSLRSEDTAMYYCA 240
    241 RQDGYYPGWFANWGQGTTVTVSSAAATTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGA 300
    301 VHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCRSKRSRLLHSDYMNMTPRRPGPTRK 360
    361 HYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPE 420
    421 MGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDAL 480
    481 HMQALPPR 488。
  17. 請求項1~16のいずれか一項に記載の方法によって産生された、低減された免疫原性を有する、CAR発現免疫細胞。
  18. 請求項17に記載の免疫細胞を含む、薬学的組成物。
  19. 薬学的に許容される賦形剤をさらに含む、請求項18に記載の薬学的組成物。
JP2022519460A 2019-09-27 2020-09-25 液体がんの治療のための組成物および方法 Active JP7615134B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024231478A JP2025066723A (ja) 2019-09-27 2024-12-27 液体がんの治療のための組成物および方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962907254P 2019-09-27 2019-09-27
US62/907,254 2019-09-27
PCT/US2020/052822 WO2021062227A2 (en) 2019-09-27 2020-09-25 Compositions and methods for treatment of liquid cancers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024231478A Division JP2025066723A (ja) 2019-09-27 2024-12-27 液体がんの治療のための組成物および方法

Publications (3)

Publication Number Publication Date
JP2022549916A JP2022549916A (ja) 2022-11-29
JP2022549916A5 JP2022549916A5 (ja) 2023-10-02
JP7615134B2 true JP7615134B2 (ja) 2025-01-16

Family

ID=75166843

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022519460A Active JP7615134B2 (ja) 2019-09-27 2020-09-25 液体がんの治療のための組成物および方法
JP2024231478A Pending JP2025066723A (ja) 2019-09-27 2024-12-27 液体がんの治療のための組成物および方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024231478A Pending JP2025066723A (ja) 2019-09-27 2024-12-27 液体がんの治療のための組成物および方法

Country Status (8)

Country Link
US (1) US12594301B2 (ja)
EP (1) EP4034138A4 (ja)
JP (2) JP7615134B2 (ja)
KR (1) KR20220090512A (ja)
CN (2) CN120905310A (ja)
AU (1) AU2020355222A1 (ja)
CA (1) CA3155667A1 (ja)
WO (1) WO2021062227A2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3847254A4 (en) 2018-09-07 2022-08-10 Beam Therapeutics Inc. COMPOSITIONS AND METHODS FOR DELIVERING A NUCLEOBASE EDITING SYSTEM
CN120174005A (zh) 2019-02-13 2025-06-20 比姆医疗股份有限公司 具有用于修饰靶标序列中核碱基的腺苷脱氨酶碱基编辑器的经修饰的免疫细胞
EP4034138A4 (en) 2019-09-27 2024-07-31 Beam Therapeutics, Inc. COMPOSITIONS AND METHODS FOR THE TREATMENT OF LIQUID CANCERS
WO2022056459A1 (en) * 2020-09-14 2022-03-17 Vor Biopharma, Inc. Compositions and methods for cd5 modification
WO2022061115A1 (en) * 2020-09-18 2022-03-24 Vor Biopharma Inc. Compositions and methods for cd7 modification
CA3196831A1 (en) 2020-09-25 2022-03-31 Beam Therapeutics Inc. Fratricide resistant modified immune cells and methods of using the same
US11459372B2 (en) 2020-11-30 2022-10-04 Crispr Therapeutics Ag Gene-edited natural killer cells
WO2022144632A1 (en) 2020-12-30 2022-07-07 Crispr Therapeutics Ag Compositions and methods for differentiating stem cells into nk cells
CN120249215A (zh) * 2021-04-27 2025-07-04 上海驯鹿生物技术有限公司 一种基因编辑的造血干细胞及其与car-t细胞的联合应用
WO2022240858A1 (en) 2021-05-10 2022-11-17 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023034475A1 (en) * 2021-09-01 2023-03-09 Arbor Biotechnologies, Inc. Cells modified by a cas12i polypeptide
JP2024537991A (ja) 2021-10-14 2024-10-18 アーセナル バイオサイエンシズ インコーポレイテッド 共発現されるshRNAと論理ゲートシステムとを有する免疫細胞
WO2023108107A2 (en) * 2021-12-10 2023-06-15 Beam Therapeutics Inc. Modified immune cells and methods of using the same
WO2023137457A2 (en) * 2022-01-13 2023-07-20 Spotlight Therapeutics Immune response specific guide rnas and uses thereof
WO2023141590A2 (en) 2022-01-21 2023-07-27 Mammoth Biosciences, Inc. Effector proteins and methods of use
JP2025516823A (ja) * 2022-05-19 2025-05-30 ライエル・イミュノファーマ・インコーポレイテッド Nr4a3を標的とするポリヌクレオチド及びその使用
EP4587570A2 (en) * 2022-09-16 2025-07-23 Arsenal Biosciences, Inc. Immune cells with combination gene perturbations
IL322949A (en) 2023-03-03 2025-10-01 Arsenal Biosciences Inc Systems targeting PSMA and CA9
EP4683650A2 (en) * 2023-03-21 2026-01-28 Beam Therapeutics Inc. Immunosuppressant-resistant modified allogeneic modified immune cells and methods for use thereof
WO2025126049A2 (en) * 2023-12-11 2025-06-19 Crispr Therapeutics Ag Multiplex gene editing
WO2026077659A1 (en) * 2024-09-17 2026-04-16 Institut National de la Santé et de la Recherche Médicale Enrichment of genetically modified hematopoietic stem cells through epigenome editing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019524156A (ja) 2016-08-03 2019-09-05 ジョン・エフ・ディパージオJohn F. DIPERSIO キメラ抗原受容体でのt細胞性悪性腫瘍の治療のためのcar−t細胞の遺伝子編集

Family Cites Families (243)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997006121A1 (en) 1995-08-04 1997-02-20 Jennings, Norman, T. Compositions and method for controlling odor in organic waste material
GB9600384D0 (en) 1996-01-09 1996-03-13 Nyfotek As Dna glycosylases
EP1235914A2 (en) 1999-11-24 2002-09-04 Joseph Rosenecker Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
WO2002068676A2 (en) 2001-02-27 2002-09-06 University Of Rochester METHODS AND COMPOSITIONS FOR MODIFYING APOLIPOPROTEIN B mRNA EDITING
AU2002330714A1 (en) 2001-05-30 2003-01-02 Biomedical Center In silico screening for phenotype-associated expressed sequences
US7300829B2 (en) 2003-06-02 2007-11-27 Applied Materials, Inc. Low temperature process for TFT fabrication
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
EP2513296A4 (en) 2009-12-18 2013-05-22 Univ Leland Stanford Junior USE OF CYTIDINE DAMINASE ASSOCIATED ACTIVITIES TO PROMOTE DEMETHYLATION AND CELL REPROGRAMMEIRING
WO2012004778A1 (en) 2010-07-09 2012-01-12 Ecole Polytechnique Federale De Lausanne (Epfl) Method for in-vitro monitoring of neuronal disorders and use thereof
CA3205636A1 (en) 2011-04-20 2012-10-26 University Of Washington Through Its Center For Commercialization Beta-2 microglobulin-deficient cells
KR102096534B1 (ko) 2011-09-28 2020-04-03 에라 바이오테크, 에스.에이. 분할된 인테인 및 그의 이용
CN103088008B (zh) 2011-10-31 2014-08-20 中国科学院微生物研究所 胞苷脱氨酶及其编码基因和它们的应用
WO2013126729A1 (en) 2012-02-22 2013-08-29 The Trustees Of The University Of Pennsylvania Use of the cd2 signaling domain in second-generation chimeric antigen receptors
US20160289674A1 (en) 2012-04-02 2016-10-06 Moderna Therapeutics, Inc. Modified polynucleotides for the production of membrane proteins
FI2838548T3 (fi) 2012-04-17 2023-10-02 Univ Washington Through Its Center For Commercialization HLA:n luokan II puutteelliset solut, HLA:n luokan II puutteelliset solut, jotka kykenevät ilmentämään HLA:n luokan II proteiineja, ja niiden käytöt
AU2013266968B2 (en) 2012-05-25 2017-06-29 Emmanuelle CHARPENTIER Methods and compositions for RNA-directed target DNA modification and for RNA-directed modulation of transcription
US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
WO2013188037A2 (en) 2012-06-11 2013-12-19 Agilent Technologies, Inc Method of adaptor-dimer subtraction using a crispr cas6 protein
EP3431497B1 (en) 2012-06-27 2022-07-27 The Trustees of Princeton University Split inteins, conjugates and uses thereof
PL3360964T3 (pl) 2012-12-06 2020-03-31 Sigma-Aldrich Co. Llc Modyfikacja i regulacja genomu oparta na crispr
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
FI2997141T3 (fi) 2013-05-13 2022-12-15 CD19-spesifinen kimeerinen antigeenireseptori ja sen käyttöjä
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
WO2014197748A2 (en) 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
EP3019595A4 (en) 2013-07-09 2016-11-30 THERAPEUTIC USES OF A GENERIC CHANGE WITH CRISPR / CAS SYSTEMS
EP3666892A1 (en) 2013-07-10 2020-06-17 President and Fellows of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
WO2015021426A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. A crispr/cas system-based novel fusion protein and its application in genome editing
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
WO2015069922A2 (en) 2013-11-06 2015-05-14 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Alk antibodies, conjugates, and chimeric antigen receptors, and their use
JP7103750B2 (ja) 2013-12-12 2022-07-20 ザ・ブロード・インスティテュート・インコーポレイテッド ゲノム編集のためのCRISPR-Cas系及び組成物の送達、使用及び治療適用
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
EP3835419A1 (en) 2013-12-12 2021-06-16 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
ES2918501T3 (es) 2013-12-19 2022-07-18 Novartis Ag Receptores de antígenos quiméricos de mesotelina humana y usos de los mismos
WO2015092024A2 (en) 2013-12-20 2015-06-25 Cellectis Method of engineering multi-input signal sensitive t cell for immunotherapy
EP3115457B1 (en) 2014-03-05 2019-10-02 National University Corporation Kobe University Genomic sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
JP6681837B2 (ja) 2014-03-11 2020-04-15 セレクティスCellectis 同種移植に適合するt細胞を作製するための方法
US20170335281A1 (en) 2014-03-15 2017-11-23 Novartis Ag Treatment of cancer using chimeric antigen receptor
EP3155116A4 (en) 2014-06-10 2017-12-27 Massachusetts Institute Of Technology Method for gene editing
KR20170032406A (ko) 2014-07-15 2017-03-22 주노 쎄러퓨티크스 인코퍼레이티드 입양 세포 치료를 위한 조작된 세포
US10544201B2 (en) 2014-07-31 2020-01-28 Cellectis ROR1 specific multi-chain chimeric antigen receptor
EP4205749A1 (en) 2014-07-31 2023-07-05 Novartis AG Subset-optimized chimeric antigen receptor-containing cells
EP3186375A4 (en) 2014-08-28 2019-03-13 North Carolina State University Novel CAS9 PROTEINS AND CHARACTERISTICS FOR DNA TARGETING AND GENOME EDITING
EP2990416B1 (en) 2014-08-29 2018-06-20 GEMoaB Monoclonals GmbH Universal chimeric antigen receptor expressing immune cells for targeting of diverse multiple antigens and method of manufacturing the same and use of the same for treatment of cancer, infections and autoimmune disorders
BR112017007765B1 (pt) 2014-10-14 2023-10-03 Halozyme, Inc Composições de adenosina deaminase-2 (ada2), variantes do mesmo e métodos de usar o mesmo
WO2016061368A1 (en) 2014-10-15 2016-04-21 The Children's Hospital Of Philadelphia Compositions and methods for treating b-lymphoid malignancies
US10258697B2 (en) 2014-10-29 2019-04-16 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
US20170335331A1 (en) 2014-10-31 2017-11-23 The Trustees Of The University Of Pennsylvania Altering Gene Expression in CART Cells and Uses Thereof
PT3216867T (pt) 2014-11-04 2020-07-16 Univ Kobe Nat Univ Corp Método para modificar a sequência de genoma para introduzir mutação específica a sequência de adn alvo por reação de remoção de bases, e complexo molecular nele utilizado
MA40921A (fr) 2014-11-05 2017-09-12 Abbvie Stemcentrx Llc Récepteurs antigéniques chimériques anti-cldn et procédés d'utilisation
WO2016075612A1 (en) 2014-11-12 2016-05-19 Rinat Neuroscience Corp. Inhibitory chimeric antigen receptors
HRP20191873T1 (hr) 2014-12-12 2020-01-24 Bluebird Bio, Inc. Kimerni antigenski receptori
EP3234134B1 (en) 2014-12-17 2020-05-27 ProQR Therapeutics II B.V. Targeted rna editing
WO2016100955A2 (en) 2014-12-20 2016-06-23 Identifygenomics, Llc Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
US11459390B2 (en) 2015-01-16 2022-10-04 Novartis Ag Phosphoglycerate kinase 1 (PGK) promoters and methods of use for expressing chimeric antigen receptor
MA41613A (fr) 2015-02-23 2018-01-02 Abbvie Stemcentrx Llc Récepteurs antigéniques chimériques anti-dll3 et procédés d'utilisation desdits récepteurs
JP7237449B2 (ja) 2015-02-27 2023-03-13 アイセル・ジーン・セラピューティクス・エルエルシー 血液系腫瘍を標的としたキメラ抗体受容体(CARs)の構成およびその使用方法
KR20230156800A (ko) 2015-03-03 2023-11-14 더 제너럴 하스피탈 코포레이션 변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제
JP2018509148A (ja) 2015-03-11 2018-04-05 セレクティスCellectis 患者における持続性および/または生着を増加させるために同種t細胞を改変する方法
AU2016243583B2 (en) 2015-03-27 2022-03-10 President And Fellows Of Harvard College Modified T cells and methods of making and using the same
JP2018522249A (ja) 2015-04-24 2018-08-09 エディタス・メディシン、インコーポレイテッド Cas9分子/ガイドrna分子複合体の評価
CN107921148A (zh) 2015-05-08 2018-04-17 哈佛学院校长同事会 通用供体干细胞和相关方法
US20180291372A1 (en) 2015-05-14 2018-10-11 Massachusetts Institute Of Technology Self-targeting genome editing system
CN106011104B (zh) 2015-05-21 2019-09-27 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
WO2016196388A1 (en) 2015-05-29 2016-12-08 Juno Therapeutics, Inc. Composition and methods for regulating inhibitory interactions in genetically engineered cells
EP3331582A4 (en) 2015-05-29 2019-08-07 Agenovir Corporation METHODS AND COMPOSITIONS FOR THE TREATMENT OF TRANSPLANTATION CELLS
TWI906646B (zh) 2015-06-18 2025-12-01 美商博得學院股份有限公司 降低脫靶效應的crispr酶突變
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
JP7033453B2 (ja) 2015-06-30 2022-03-10 セレクティス 特異的エンドヌクレアーゼを使用した遺伝子不活化によってnk細胞の機能性を改善する方法
JP7044373B2 (ja) 2015-07-15 2022-03-30 ラトガース,ザ ステート ユニバーシティ オブ ニュージャージー ヌクレアーゼ非依存的な標的化遺伝子編集プラットフォームおよびその用途
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
CA2997551A1 (en) 2015-09-04 2017-03-09 Memorial Sloan Kettering Cancer Center Immune cell compositions and methods of use
AU2016323985B2 (en) 2015-09-17 2022-12-15 Novartis Ag CAR T cell therapies with enhanced efficacy
US11008555B2 (en) 2015-09-17 2021-05-18 The Regents Of The University Of California Variant Cas9 polypeptides comprising internal insertions
IL310721B2 (en) 2015-10-23 2025-11-01 Harvard College Nucleobase editors and uses thereof
US11020429B2 (en) 2015-11-05 2021-06-01 Juno Therapeutics, Inc. Vectors and genetically engineered immune cells expressing metabolic pathway modulators and uses in adoptive cell therapy
BR112018008442A2 (pt) 2015-11-05 2018-11-06 Juno Therapeutics Inc receptores quiméricos contendo domínios induto-res de traf e composições e métodos relacionados
BR112018008971A2 (pt) 2015-11-06 2018-11-27 Crispr Therapeutics Ag materiais e métodos para tratamento de doença de armazenamento de glicogênio tipo 1a
CN109715801B (zh) 2015-12-01 2022-11-01 克里斯普治疗股份公司 用于治疗α1抗胰蛋白酶缺乏的材料和方法
WO2017093969A1 (en) 2015-12-04 2017-06-08 Novartis Ag Compositions and methods for immunooncology
PT3408292T (pt) 2016-01-29 2023-07-19 Univ Princeton Inteínas divididas com excecional atividade de splicing
EP3423580A1 (en) 2016-03-04 2019-01-09 Editas Medicine, Inc. Crispr-cpf1-related methods, compositions and components for cancer immunotherapy
US11512311B2 (en) 2016-03-25 2022-11-29 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
LT3436077T (lt) 2016-03-30 2025-06-25 Intellia Therapeutics, Inc. Lipidų nanodalelių vaisto formos, skirtos crispr/cas komponentams
US11446398B2 (en) 2016-04-11 2022-09-20 Obsidian Therapeutics, Inc. Regulated biocircuit systems
EP3443002A4 (en) 2016-04-14 2019-12-04 Bluebird Bio, Inc. SYSTEMS FOR RECOVERED CHIMERIC ANTIGEN RECEPTORS
KR20260004568A (ko) 2016-04-19 2026-01-08 더 브로드 인스티튜트, 인코퍼레이티드 신규한 crispr 효소 및 시스템
AU2017257274B2 (en) 2016-04-19 2023-07-13 Massachusetts Institute Of Technology Novel CRISPR enzymes and systems
KR20190039703A (ko) 2016-07-05 2019-04-15 더 존스 홉킨스 유니버시티 Crispr/cas9-기반 조성물 및 망막 변성을 치료하기 위한 방법
WO2018020323A2 (en) 2016-07-25 2018-02-01 Crispr Therapeutics Ag Materials and methods for treatment of fatty acid disorders
CN110214183A (zh) 2016-08-03 2019-09-06 哈佛大学的校长及成员们 腺苷核碱基编辑器及其用途
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
EP4485466A3 (en) 2016-08-17 2025-04-02 The Broad Institute Inc. Novel crispr enzymes and systems
CN110352244B (zh) 2016-09-01 2023-03-21 ProQR治疗上市公司Ⅱ 化学修饰的编辑rna的单链寡核苷酸
KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018085690A1 (en) 2016-11-04 2018-05-11 Bluebird Bio, Inc. Anti-bcma car t cell compositions
EP3538561A4 (en) 2016-11-11 2020-10-21 The Regents of The University of California RNA-GUIDED VARIANT POLYPEPTIDES AND THEIR METHODS OF USE
CN107043779B (zh) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
SG10202106058WA (en) 2016-12-08 2021-07-29 Intellia Therapeutics Inc Modified guide rnas
TWI851534B (zh) 2016-12-22 2024-08-11 美商英特利亞醫療公司 用於治療α-1抗胰蛋白酶缺乏症之組合物及方法
GB201622044D0 (en) 2016-12-22 2017-02-08 Ucl Business Plc T cell-targeted T cells
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
KR20230125856A (ko) 2016-12-23 2023-08-29 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Pcsk9의 유전자 편집
EP3565608A4 (en) 2017-01-05 2020-12-16 Rutgers, The State University of New Jersey TARGETED GENE EDITING PLATFORM INDEPENDENT OF BICATENARY DNA BREAKAGE AND ITS USES
WO2018132479A1 (en) 2017-01-10 2018-07-19 The General Hospital Corporation Modified t cells and methods of their use
ES2912408T3 (es) 2017-01-26 2022-05-25 Novartis Ag Composiciones de CD28 y métodos para terapia con receptores quiméricos para antígenos
WO2018152197A1 (en) 2017-02-15 2018-08-23 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
RU2019130504A (ru) 2017-02-28 2021-03-30 Вор Байофарма, Инк. Композиции и способы ингибирования линиеспецифических белков
US12390514B2 (en) * 2017-03-09 2025-08-19 President And Fellows Of Harvard College Cancer vaccine
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20240116572A (ko) 2017-03-23 2024-07-29 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
US20200101108A1 (en) 2017-03-31 2020-04-02 The Board Of Trustees Of The Le-Land Standford Junior University Methods of treating t cell exhaustion by inhibiting or modulating t cell receptor signaling
CN106916852B (zh) 2017-04-13 2020-12-04 上海科技大学 一种碱基编辑系统及其构建和应用方法
US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
CN118948892A (zh) 2017-05-01 2024-11-15 朱诺治疗学股份有限公司 细胞疗法与免疫调节化合物的组合
US11866697B2 (en) 2017-05-18 2024-01-09 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
WO2018213726A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
US20200171135A1 (en) 2017-05-24 2020-06-04 The Regents Of The University Of California CMV Vaccine and Method of Making and Using the Same
EP3630849A4 (en) 2017-05-25 2021-01-13 The General Hospital Corporation BIPARTITE BASIC EDITOR (BBE) AND TYPE II-C-CAS9 ZINC FINGER EDITOR ARCHITECTURES
CN110944652A (zh) 2017-06-12 2020-03-31 爱莫里大学 T细胞抗原靶向的嵌合抗原受体(car)以及在细胞疗法中的用途
WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
KR102761791B1 (ko) 2017-06-26 2025-02-05 더 브로드 인스티튜트, 인코퍼레이티드 표적화된 핵산 편집을 위한 crispr/cas-아데닌 데아미나아제 기반 조성물, 시스템 및 방법
US10392616B2 (en) 2017-06-30 2019-08-27 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
CA3069527A1 (en) 2017-07-12 2019-01-17 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for treatment of cancers harboring an h3k27m mutation
US11740242B2 (en) 2017-07-14 2023-08-29 Dana-Farber Cancer Institute, Inc. Modulating biomarkers to increase tumor immunity and improve the efficacy of cancer immunotherapy
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
CA3073448A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
EP3676376B1 (en) 2017-08-30 2025-01-15 President and Fellows of Harvard College High efficiency base editors comprising gam
WO2019071274A1 (en) 2017-10-06 2019-04-11 Oregon Health & Science University Compositions and methods for editing rna
KR20250107288A (ko) 2017-10-16 2025-07-11 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
EP3723774A4 (en) 2017-12-15 2021-09-08 The Board of Trustees of the Leland Stanford Junior University COMPOSITIONS AND METHODS OF INHIBITION OF T-CELL EXHAUSTATION
CN109957569B (zh) 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法
CA3177757A1 (en) * 2018-02-16 2019-08-22 Kite Pharma, Inc. Modified pluripotent stem cells and methods of making and use
WO2019178225A2 (en) * 2018-03-13 2019-09-19 Regents Of The University Of Minnesota Lymphohematopoietic engineering using cas9 base editors
US20210363518A1 (en) 2018-03-19 2021-11-25 University Of Massachusetts Modified guide rnas for crispr genome editing
EP3781176A4 (en) 2018-04-09 2022-05-25 The Trustees of the University of Pennsylvania METHODS AND COMPOSITIONS USING A VIRAL VECTOR FOR THE EXPRESSION OF A TRANSGENE AND AN EFFECTOR
US12473342B2 (en) 2018-04-27 2025-11-18 The Trustees Of The University Of Pennsylvania Chimeric antigen receptor T regulatory cells for the treatment of atherosclerosis
AU2019265019B2 (en) 2018-05-11 2025-11-06 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
CN119570787A (zh) 2018-05-11 2025-03-07 比姆医疗股份有限公司 使用可编程碱基编辑器系统遏止病原性突变的方法
KR20250133482A (ko) 2018-05-11 2025-09-05 빔 테라퓨틱스, 인크. 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일 뉴클레오티드 다형성을 편집하는 방법
US12157760B2 (en) 2018-05-23 2024-12-03 The Broad Institute, Inc. Base editors and uses thereof
CN110616189B (zh) 2018-06-20 2022-02-18 西安桑尼赛尔生物医药有限公司 通用型靶向cd19抗原嵌合受体t细胞的制备及其应用
CN108753823B (zh) 2018-06-20 2022-09-23 李广磊 利用碱基编辑技术实现基因敲除的方法及其应用
WO2020010239A1 (en) 2018-07-06 2020-01-09 The Board Of Trustees Of The Leland Stanford Junior University Chimeric antigen receptor polypeptides and methods of using same
CN108949825A (zh) 2018-07-30 2018-12-07 苏州茂行生物科技有限公司 一种靶向her2的car-t细胞的制备方法及应用
CA3108281A1 (en) 2018-08-03 2020-02-06 Beam Therapeutics Inc. Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
EP3841203A4 (en) 2018-08-23 2022-11-02 The Broad Institute Inc. CAS9 VARIANTS WITH NON-CANONICAL PAM SPECIFICITIES AND THEIR USES
EP3847254A4 (en) 2018-09-07 2022-08-10 Beam Therapeutics Inc. COMPOSITIONS AND METHODS FOR DELIVERING A NUCLEOBASE EDITING SYSTEM
CN109295186B (zh) 2018-09-30 2023-10-03 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
EP3886869A4 (en) 2018-11-28 2022-07-06 Forty Seven, Inc. GENETICALLY MODIFIED ABLATION-RESISTANT HSPCS
EP3887521A1 (en) 2018-11-29 2021-10-06 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
US12454562B2 (en) 2018-12-06 2025-10-28 The Board Of Trustees Of The Leland Stanford Junior University Regulatable cell surface receptors and related compositions and methods
CN113454117B (zh) 2018-12-19 2025-07-04 宾夕法尼亚大学董事会 Cd2/5/7敲除抗-cd2/5/7嵌合抗原受体t细胞针对t细胞淋巴瘤和白血病的用途
EP3911735A4 (en) 2019-01-16 2023-07-12 Beam Therapeutics, Inc. MODIFIED IMMUNE CELLS WITH INCREASED ANTINEOPLASTIC ACTIVITY AND RESISTANCE TO IMMUNOSUPPRESSION
CN109706121A (zh) * 2019-01-25 2019-05-03 苏州茂行生物科技有限公司 一种基于碱基编辑的通用型car-t细胞及其制备方法和应用
WO2020160517A1 (en) 2019-01-31 2020-08-06 Beam Therapeutics Inc. Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
AU2020215730A1 (en) 2019-01-31 2021-07-29 Beam Therapeutics Inc. Nucleobase editors having reduced non-target deamination and assays for characterizing nucleobase editors
US11946040B2 (en) 2019-02-04 2024-04-02 The General Hospital Corporation Adenine DNA base editor variants with reduced off-target RNA editing
US20230140953A1 (en) 2019-02-13 2023-05-11 Beam Therapeutics Inc. Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
JP7693552B2 (ja) 2019-02-13 2025-06-17 ビーム セラピューティクス インク. アデノシンデアミナーゼ塩基エディターおよびそれを用いて標的配列中の核酸塩基を改変する方法
US20220098593A1 (en) 2019-02-13 2022-03-31 Beam Therapeutics Inc. Splice acceptor site disruption of a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
WO2020168088A1 (en) 2019-02-13 2020-08-20 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a
KR20210126680A (ko) 2019-02-13 2021-10-20 빔 테라퓨틱스, 인크. 알파-1 항트립신 결핍증을 치료하기 위한 조성물 및 방법
CN120174005A (zh) * 2019-02-13 2025-06-20 比姆医疗股份有限公司 具有用于修饰靶标序列中核碱基的腺苷脱氨酶碱基编辑器的经修饰的免疫细胞
CA3128755C (en) 2019-02-13 2024-06-04 Beam Therapeutics Inc. Compositions and methods for treating hemoglobinopathies
PE20211959A1 (es) 2019-02-15 2021-09-30 Editas Medicine Inc Celulas asesinas naturales (nk) modificadas para inmunoterapia
WO2020176897A1 (en) 2019-02-28 2020-09-03 The Board Of Trustees Of The Leland Stanford Junior University Chimeric antigen receptors and uses thereof
JP7654557B2 (ja) 2019-03-27 2025-04-01 ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア Tn-MUC1キメラ抗原受容体(CAR)T細胞療法
US12473543B2 (en) 2019-04-17 2025-11-18 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
EP3965897A4 (en) 2019-05-07 2023-01-04 The Board of Trustees of the Leland Stanford Junior University CHEMERA ANTIGEN RECEPTORS TARGETING GLYPICAN-2
EP3966236A4 (en) 2019-05-07 2023-05-10 The Board of Trustees of the Leland Stanford Junior University Enhancement of polypeptides and chimeric antigen receptors via hinge domains
US20220249697A1 (en) 2019-05-20 2022-08-11 The Broad Institute, Inc. Aav delivery of nucleobase editors
WO2020236964A1 (en) 2019-05-20 2020-11-26 The Trustees Of The University Of Pennsylvania Engineered expression of cell surface and secreted sialidase by car t cells for increased efficacy in solid tumors
AU2020279751A1 (en) 2019-05-21 2021-12-02 Beam Therapeutics Inc. Methods of editing a single nucleotide polymorphism using programmable base editor systems
KR20220015382A (ko) 2019-05-29 2022-02-08 큐 바이오파마, 인크. 다량체 t-세포 조절 폴리펩타이드 및 이의 사용 방법
WO2021022043A2 (en) 2019-07-30 2021-02-04 Pairwise Plants Services, Inc. Morphogenic regulators and methods of using the same
KR102258713B1 (ko) 2019-07-31 2021-05-31 한양대학교 산학협력단 사이토신 염기교정용 조성물 및 이의 용도
EP4022051A4 (en) 2019-08-29 2024-01-10 Beam Therapeutics Inc. COMPOSITIONS AND METHODS FOR NON-TOXIC CONDITIONING
WO2021042062A2 (en) 2019-08-30 2021-03-04 Joung J Keith Combinatorial adenine and cytosine dna base editors
AU2020344547A1 (en) 2019-09-09 2022-03-24 Beam Therapeutics Inc. Novel nucleobase editors and methods of using same
AU2020466994A1 (en) 2019-09-17 2022-04-21 Rutgers, The State University Of New Jersey Highly efficient DNA base editors mediated by RNA-aptamer recruitment for targeted genome modification and uses thereof
EP4034138A4 (en) 2019-09-27 2024-07-31 Beam Therapeutics, Inc. COMPOSITIONS AND METHODS FOR THE TREATMENT OF LIQUID CANCERS
CA3154218A1 (en) 2019-10-11 2021-04-15 Crystal Mackall Recombinant polypeptides for regulatable cellular localization
WO2021081264A1 (en) 2019-10-24 2021-04-29 Pairwise Plants Services, Inc. Optimized crispr-cas nucleases and base editors and methods of use thereof
EP4051788A4 (en) 2019-10-30 2023-12-06 Pairwise Plants Services, Inc. TYPE V CRISPR CAS BASE EDITORS AND METHODS OF USE THEREOF
WO2021087356A1 (en) 2019-11-01 2021-05-06 The Trustees Of The University Of Pennsylvania Fibronectin targeting chimeric antigen receptors (cars)
AU2020388690A1 (en) 2019-11-20 2022-06-09 Cartherics Pty. Ltd. Method for providing immune cells with enhanced function
US20230086199A1 (en) 2019-11-26 2023-03-23 The Broad Institute, Inc. Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
IL293946A (en) 2019-12-18 2022-08-01 Editas Medicine Inc Engineered cells for therapy
US20210230246A1 (en) 2020-01-15 2021-07-29 The Trustees Of The University Of Pennsylvania Use of inhibitory chimeric receptors to prevent t cell-induced blood brain barrier damage
EP4100032B1 (en) 2020-02-05 2025-10-15 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
EP4100519A2 (en) 2020-02-05 2022-12-14 The Broad Institute, Inc. Adenine base editors and uses thereof
MX2022009827A (es) 2020-02-14 2022-09-05 Univ Leland Stanford Junior Receptores de antigenos quimericos con activacion de cd2.
JP2023517890A (ja) 2020-03-04 2023-04-27 スージョウ チー バイオデザイン バイオテクノロジー カンパニー リミテッド 改善されたシトシン塩基編集システム
JP2023518395A (ja) 2020-03-19 2023-05-01 インテリア セラピューティクス,インコーポレイテッド 指向性ゲノム編集のための方法及び組成物
EP4132951A4 (en) 2020-04-09 2025-06-11 Verve Therapeutics, Inc. CHEMICALLY MODIFIED GENE EDITING GUIDE RNAS WITH CAS12B
WO2022008935A1 (en) 2020-07-10 2022-01-13 Horizon Discovery Limited Method for producing genetically modified cells
US20240247242A1 (en) 2020-07-15 2024-07-25 LifeEDIT Therapeutics, Inc. Uracil stabilizing proteins and active fragments and variants thereof and methods of use
JP2023540797A (ja) 2020-09-11 2023-09-26 メタゲノミ,インコーポレイテッド 塩基編集酵素
MX2023002848A (es) 2020-09-11 2023-03-22 Lifeedit Therapeutics Inc Enzimas modificadoras del acido desoxirribonucleico (adn) y fragmentos activos y sus variantes y metodos de uso.
WO2022061115A1 (en) * 2020-09-18 2022-03-24 Vor Biopharma Inc. Compositions and methods for cd7 modification
CA3196831A1 (en) 2020-09-25 2022-03-31 Beam Therapeutics Inc. Fratricide resistant modified immune cells and methods of using the same
CA3198671A1 (en) 2020-10-14 2022-04-21 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a
IT202000028688A1 (it) 2020-11-27 2022-05-27 Consiglio Nazionale Ricerche Varianti della citidina deaminasi per l’editazione di basi
CA3207144A1 (en) 2021-01-05 2022-07-14 Horizon Discovery Limited Method for producing genetically modified cells
WO2022150372A1 (en) 2021-01-05 2022-07-14 Horizon Discovery Ltd. Guide rna designs and complexes for type v cas systems
JP2024502348A (ja) 2021-01-05 2024-01-18 ホライズン・ディスカバリー・リミテッド Tracr不含 V型Casシステム用のガイドRNAデザインおよび複合体
EP4274897A4 (en) 2021-01-08 2025-03-05 The General Hospital Corporation GENOMEDITING APPROACHES TO THE TREATMENT OF SPINAL MUSCLE ATROPHY
CA3208612A1 (en) 2021-02-19 2022-08-25 Beam Therapeutics Inc. Recombinant rabies viruses for gene therapy
EP4313118A4 (en) 2021-03-26 2025-06-18 Beam Therapeutics Inc. ADENOSINE DEAMINASE VARIANTS AND THEIR USES
EP4359541A4 (en) 2021-06-23 2025-04-30 Editas Medicine, Inc. Engineered cells for therapy
US20240327859A1 (en) 2021-07-02 2024-10-03 University Of Maryland, College Park Cytidine deaminases and methods of genome editing using the same
CA3225808A1 (en) 2021-07-16 2023-01-19 David R. Liu Context-specific adenine base editors and uses thereof
AU2022331424A1 (en) 2021-08-16 2024-02-22 Beam Therapeutics Inc. Persistent allogeneic modified immune cells and methods of use thereof
US20240352439A1 (en) 2021-09-03 2024-10-24 The University Of Chicago Polypeptides and methods for modifying nucleic acids
IL311607A (en) 2021-09-22 2024-05-01 Verve Therapeutics Inc PCSK9 or ANGPTL3 gene editing and preparations and methods for using them to treat the disease
US20230105319A1 (en) 2021-09-24 2023-04-06 Crispr Therapeutics Ag PRODRUG INCORPORATED sgRNA SYNTHESIS
WO2023108107A2 (en) 2021-12-10 2023-06-15 Beam Therapeutics Inc. Modified immune cells and methods of using the same
WO2023125814A1 (zh) 2021-12-29 2023-07-06 华东师范大学 腺嘌呤脱氨酶及其应用
CN119013310A (zh) 2022-02-17 2024-11-22 正序(上海)生物科技有限公司 具有改善的编辑精确度的突变的胞嘧啶脱氨酶
CN114634923B (zh) 2022-04-07 2024-02-23 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
EP4532704A2 (en) 2022-05-26 2025-04-09 UCB Biopharma SRL Novel nucleic acid-editing proteins
EP4532697A2 (en) 2022-06-03 2025-04-09 Beam Therapeutics Inc. Modified regulatory t cells and methods of using the same
EP4540378A1 (en) 2022-06-20 2025-04-23 CRISPR Therapeutics AG Base editing proteins and uses thereof
AU2023288909A1 (en) 2022-06-23 2025-01-09 Basf Agricultural Solutions Us Llc Diversifying base editing
EP4544035A2 (en) 2022-06-27 2025-04-30 Beam Therapeutics Inc. Adenosine deaminase base editors and methods for use thereof
WO2024040083A1 (en) 2022-08-16 2024-02-22 The Broad Institute, Inc. Evolved cytosine deaminases and methods of editing dna using same
KR20250075667A (ko) 2022-09-23 2025-05-28 기초과학연구원 신규한 아데닌 탈아미노효소 변이체 및 이를 사용한 염기 교정 방법
EP4594486A2 (en) 2022-09-26 2025-08-06 Beam Therapeutics Inc. Synthetic polypeptides and uses thereof
WO2024179426A2 (en) 2023-02-28 2024-09-06 Accuredit Therapeutics (Suzhou) Co., Ltd. Deaminases for use in base editing
EP4688814A1 (en) 2023-04-27 2026-02-11 University of Massachusetts Cas-embedded cytidine deaminase ribonucleoprotein complexes having improved base editing specificity and efficiency
CN121079412A (zh) 2023-04-28 2025-12-05 比姆医疗股份有限公司 经修饰的指导rna
AU2024303631A1 (en) 2023-06-15 2025-12-11 Beam Therapeutics Inc. Methods and compositions for treating alpha-1 antitrypsin deficiency
CN117965505A (zh) 2023-06-28 2024-05-03 微光基因(苏州)有限公司 工程化的腺苷脱氨酶及碱基编辑器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019524156A (ja) 2016-08-03 2019-09-05 ジョン・エフ・ディパージオJohn F. DIPERSIO キメラ抗原受容体でのt細胞性悪性腫瘍の治療のためのcar−t細胞の遺伝子編集

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Steven M. Banik et. al.,Lysosome-targeting chimaeras for degradation of extracellular proteins,Nature,2020年07月29日,Vol 584,Page 291-297, Methods, Fig.1-9, etc.,https://doi.org/10.1038/s41586-020-2545-9

Also Published As

Publication number Publication date
WO2021062227A3 (en) 2021-05-06
CA3155667A1 (en) 2021-04-01
WO2021062227A2 (en) 2021-04-01
EP4034138A2 (en) 2022-08-03
CN115279398A (zh) 2022-11-01
US20230021636A1 (en) 2023-01-26
JP2025066723A (ja) 2025-04-23
US12594301B2 (en) 2026-04-07
JP2022549916A (ja) 2022-11-29
AU2020355222A1 (en) 2022-03-24
CN120905310A (zh) 2025-11-07
KR20220090512A (ko) 2022-06-29
CN115279398B (zh) 2025-07-04
EP4034138A4 (en) 2024-07-31

Similar Documents

Publication Publication Date Title
JP7615134B2 (ja) 液体がんの治療のための組成物および方法
JP7672982B2 (ja) 標的配列中の核酸塩基を改変するためのアデノシンデアミナーゼ塩基エディターを有する改変された免疫細胞
AU2020336969B2 (en) Compositions and methods for non-toxic conditioning
US11155803B2 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
CN114072509B (zh) 脱氨反应脱靶减低的核碱基编辑器和使用其修饰核碱基靶序列的方法
US11952408B2 (en) HPV-specific binding molecules
US20240287453A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
US12227776B2 (en) Engineered cascade components and cascade complexes
JP2021523739A (ja) プログラム可能な塩基エディターシステムを用いて単一ヌクレオチド多型を編集する方法
US12576151B2 (en) Fratricide resistant modified immune cells and methods of using the same
US20230083383A1 (en) Compositions and methods for targeting, editing or modifying human genes
US20240325533A1 (en) Modified immune cells and methods of using the same
US20250034558A1 (en) Compositions and methods for targeting, editing or modifying human genes
CN118234865A (zh) 持久性同种异体修饰免疫细胞及其使用方法
US20260071197A1 (en) Engineered cascade components and cascade complexes
EP4388097A1 (en) Method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230922

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241227

R150 Certificate of patent or registration of utility model

Ref document number: 7615134

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150