Research Results 研究成果

ヒト遺伝子の“型”を網羅 データベース「JoGo」一般公開

~1.9万遺伝子に対する470万の配列型を収載、病気や遺伝解析を後押し~
生体防御医学研究所
長﨑 正朗 教授
2025.12.03
研究成果Life & HealthMath & DataTechnology

ポイント

  • 全遺伝子の“型”を統一規則で記述する共通言語が求められていた
  • 世界初、ヒト1.9万の遺伝子の“型”をACTG階層で体系化した辞書を構築
  • 遺伝子の個人差は「点」から「線」の時代へ、医療・創薬への応用に期待

概要

遺伝子の型は身近な例に、血液型が挙げられます。遺伝子は塩基配列から構成されており、その塩基配列の型(ハプロタイプ(※1))は個人ごとに(または一人一人、人によって)少しずつ違います。その違いが遺伝子の発現量や薬の代謝機能といった遺伝子機能の差を生み出すことが知られています。しかし、全遺伝子を網羅する共通の“型”の命名法や辞書は、これまでありませんでした。九州大学生体防御医学研究所の長﨑正朗教授らは、汎用的な新規遺伝子型表記法(ACTG階層命名法(※2))を確立し、ヒトの19,194遺伝子について、4,656,478個の遺伝子型を整理しました。本データベースは、JoGo(Joint Open Genome and Omics:ジョーゴ; https://jogo.csml.org(※3)からアクセスできます。

JoGoは、世界集団(※4)を対象に、長鎖型シークエンサ(※5)の情報に基づき、遺伝子型を統一規則でカタログ化した世界初のデータベースです。今回公開した同データベースの1.0版であるJoGo 1.0では、5大陸の258人から得られた全ゲノム長鎖型シークエンサ由来の塩基配列情報を解析しました(このうち108人は本プロジェクトチームが測定)。ACTG階層命名法は、A(アミノ酸)/C(コーディング)/T(転写:UTR)/G(遺伝子本体)の遺伝子型を定義し、世界集団における頻度順でIDを付番します。また、国際参照配列(※6)(GRCh38とCHM13v2)由来の遺伝子型も収載しており、同一の番号空間で直接比較できるのが特徴です。さらに、臨床、形質、遺伝子発現に関連する公共データベース(ClinVar (※7)、GWAS Catalog (※8)、GTEx (※9)など)の情報を、遺伝子型に重ねて閲覧できます。本ACTG階層命名法により、ゲノム・メディカルサイエンスの遺伝子を表現するための辞書に、いままで遺伝子解析は、個々の変異という「点」の情報が中心でしたが、ACTG階層命名法により、遺伝子全体の配列型という「線」の情報を扱えるようになります。この辞書を整備することで、病気との関連や薬の反応をより高い解像度で把握できるようになります。JoGo 1.0では、オンラインでの遺伝子型の閲覧機能に加え、個人データを外部に出さないローカル閲覧にも対応しています。本成果はNucleic Acids ResearchにBreakthrough Article(※10)として2025年11月29日に掲載されました。

研究者からひとこと

遺伝子型の身近な例に、血液型が挙げられます。例えば、ABO遺伝子(※11)の配列型が血液型を決めます。JoGoのACTGハプロタイプ命名規則を用いることで、ヒトの持つ約2万の遺伝子についても、遺伝子型に基づく共通言語で議論できるようになります。近い将来、「私は〇〇遺伝子型が××型なのでこの匂いが好きだ」といった表現が、一般社会にも普及していくことを期待しています。(長﨑 正朗)

用語解説

(※1)ハプロタイプ
同じ染色体上で一緒に受け継がれる複数の変化(変異)の組み合わせ。単独の変異よりも、まとまりとして機能に影響することがある。

(※2)ACTG階層命名法
本研究で確立された新規遺伝子型命名方式。遺伝子配列型をA(アミノ酸)/C(コーディング=たんぱく質領域)/T(転写産物=UTR含む)/G(遺伝子本体=イントロン含む)の階層で表し、頻度順にIDを付ける。

(※3)JoGo(Joint Open Genome and Omics:ジョーゴ)
長鎖型シークエンサの情報を基盤に、人類集団における遺伝子型(ハプロタイプ)をカタログ化した本研究で確立・実装された公開データベース。https://jogo.csml.org/ からアクセスできる。

(※4)世界集団
アフリカ、ヨーロッパ、東アジア、南アジア、アメリカの5大陸の多様な個体群を指す。

(※5)長鎖型シークエンサ
長いDNA断片(数万塩基)を読み取れる測定装置。短鎖型シークエンサ(※15)に比べ長いDNA断片を読み取れるため、遺伝子全体の配列型が把握しやすい。

(※6)国際参照配列(リファレンス配列)
国際的に普及しているヒトの代表的な参照配列の名称。いくつかのバージョンがあり、GRCh38やCHM13v2などが挙げられる。

(※7)ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/)
臨床的に意味のある変異情報を集めた公開データベース。

(※8)GWAS Catalog (https://www.ebi.ac.uk/gwas/)
病気や体質(形質)と関連が報告された変異のカタログ。

(※9)GTEx (https://gtexportal.org/)
ヒトの臓器ごとの遺伝子発現と遺伝的違いの関係を集めたプロジェクト/データベース。

(※10)Nucleic Acid Research Breakthrough Article
国際誌 Nucleic Acids Research において、独創性・重要性・科学的完成度が特に高いと編集部が認定した論文にのみ与えられる特別区分です。全掲載論文の上位2~3% 程度に選ばれる極めて希少なカテゴリであり、研究分野に新たな方向性や大きな進展をもたらす成果として評価されたことを示します。

(※11)ABO遺伝子
ABO式血液型は、赤血球表面に存在する糖鎖抗原の違いによって決まる。A型糖鎖には末端にN-アセチルガラクトサミンが、B型糖鎖にはガラクトースが付加される。これらの糖を付加する糖転移酵素をコードする ABO 遺伝子は 9 番染色体上にあり、この遺伝子内には A 型を規定する多型、B 型を規定する多型、さらに酵素活性が欠損して糖鎖を付加できない O 型を規定する多型など、複数の変異箇所が存在する。
父母から 1 本ずつ受け継ぐ 2 本のABO遺伝子には、それぞれ複数の変異の組み合わせ(ハプロタイプ)が存在し、その 2 本のハプロタイプの組み合わせによって A・B・O の型が決まる。これらの組み合わせとして AA、AO、BB、BO、AB、OO などの遺伝子型が生じ、A 型(AA・AO)、B 型(BB・BO)、AB 型(AB)、O 型(OO)として分類される。

論文情報

掲載誌:Nucleic Acids Research
タイトル:JoGo 1.0: the ACTG hierarchical nomenclature and database covering 4.7 million haplotypes across 19,194 human genes(JoGo 1.0:ACTG階層的命名法と、19,194ヒト遺伝子にわたる470万ハプロタイプを収載するデータベース)
著者名:長﨑 正朗*, 片山 俊明, 守屋 勇樹, Yayoi Sekiya, 川島 秀一, 寺岡 凌, 町田 宗聡, 松原 太一, 橋本 洋希, 浅倉 章宏, 永野 朗夫, 山下 理宇, 高田 豊行, 三橋 信孝, 鎌田 真由美, 大川 恭行, 徳永 勝士, 河合 洋介, バリアント情報標準化研究会
(*:筆頭著者、責任著者)
DOI:10.1093/nar/gkaf1232