自然免疫に重要なKIR遺伝子領域の構造を解明 ~高深度シークエンス技術と配列決定アルゴリズムを実装~
- 記者発表
発表のポイント
◆ヒトの自然免疫応答に重要な役割を果たすキラー細胞免疫グロブリン様受容体(KIR)遺伝子領域の構造を解明
◆KIR遺伝子はヒトゲノム中で代表的な高度多型性・複雑構造領域だったが、独自の高深度シークエンス技術と集学的数理解析手法の開発により日本人1,173名の高精度KIR配列決定に成功
◆コンピューター上で簡便にKIR遺伝子配列の個人差を推定可能にするインピュテーション法 ※1 を実装し、様々な疾患やヒト形質とKIR遺伝子型との関連解析が可能に
発表概要
大阪大学大学院医学系研究科の坂上沙央里助教(研究当時、現ハーバード大学医学部博士研究員)、岡田随象教授(遺伝統計学 / 理化学研究所生命医科学研究センター システム遺伝学チーム チームリーダー)、金沢大学医薬保健研究域医学系革新ゲノム情報学分野 細道一善准教授、情報・システム研究機構 国立遺伝学研究所 井ノ上逸朗教授、理化学研究所生命医科学研究センター 山本一彦センター長、東京大学大学院新領域創成科学研究科 松田浩一 教授らの研究グループは、キラー細胞免疫グロブリン様受容体(KIR)遺伝子領域の構造を高精度に解明し、ヒト疾患への関わりを明らかにしました(図1)。
KIR遺伝子は、ナチュラルキラー(NK)細胞 ※2 表面に発現しHLA ※3 分子を認識してその機能を調節していることから、ヒトの自然免疫応答や移植後拒絶反応に重要な役割を果たすと考えられています。しかしその重要性にも関わらず、KIR遺伝子領域は高度な多様性を持つことから、詳細な解析が困難で集団中での構造多様性の全貌が謎のままでした。
今回研究グループは、KIR遺伝子構造に特化した独自の高深度シークエンス技術の開発と、機械学習や深層学習の手法を応用した遺伝子コピー数 ※4 推定・遺伝的変異・アレル組み合わせを網羅する解析アルゴリズムの実装により、日本人集団1,173名の高精度タイピングに成功しました。さらに、より多くのサンプルを対象としたゲノムデータにおいても、コンピューター上で簡便にKIR遺伝子配列の個人差(KIR遺伝子型)を特定するためにインピュテーション法を実装し、様々な疾患やヒト形質とKIR遺伝子型との網羅的関連解析が可能になりました。バイオバンク・ジャパン ※5 のゲノム・表現型情報を対象に解析を実施したところ、これまで報告されてきたKIR遺伝子と自己免疫疾患との関わりは想定されていたより弱いことが示唆されました。研究グループは本研究で得られた独自の解析アルゴリズムと日本人集団内でのKIR遺伝子型参照配列パネルを公開し、インピュテーション法の実装と合わせて今後さらに多くのデータへ応用する道を開き、免疫疾患や造血幹細胞移植の成績との関連を明らかにすることが期待されます。
本研究成果は、米国科学誌「Cell Genomics」に、2022年3月10日(木)午前1時(日本時間)に公開されました。
発表内容
研究の背景
全ゲノムシークエンスをはじめとする次世代シークエンサー ※6 データが広く扱われるようになったこの数年で、ヒトの遺伝的変異と将来の疾患リスクとの関係が網羅的に明らかになってきました。しかしながら、「全ゲノム」解析と言いながらも一部のヒトゲノム領域は解析困難領域として依然謎のままです。自然免疫機能に重要な役割を果たす19番染色体上のKIR遺伝子も、その困難領域の一つとして挙げられます。NK細胞の表面にはHLAクラスI分子を認識する受容体としてKIRが発現し、その相互作用により標的細胞に抑制性あるいは活性性のシグナルを与え自然免疫機能を調節しています。HLA遺伝子が多様な外来抗原や自己分子に対応するために高度な多様性を保持するように進化してきたのと同様に、KIR遺伝子にも様々なレベルの多様性が保持されています。HLA遺伝子と比較してもKIR遺伝子の解析が困難だった理由として、領域内類似配列によるターゲットシークエンス設計の難しさや、遺伝子内の遺伝的変異数が極めて多いことのみならず、個人間で遺伝子コピー数が異なり欠失挿入などの構造変異も加わり高度な多様性を構成していることが挙げられます。しかし、造血幹細胞移植領域で移植成績にHLA遺伝子と同様にKIR遺伝子の多様性の関与が示唆されるなど、この領域の多様性を解明することの医療的な意義は大きいと考えられてきました。
本研究の成果
研究グループでは、KIR遺伝子の多様性を解析するのに特化したターゲットキャプチャー法と次世代シークエンス技術を用いて日本人集団1,173名の高深度KIRシークエンスを実施しました。さらに、カーネル密度推定 ※7 による遺伝子コピー数推定、コピー数を得た上での遺伝的変異の特定、深層学習ソフトDeepVariantを用いた挿入欠失変異の特定、これらの集学的変異情報とアレル組み合わせの網羅的比較を実施し、独自のアルゴリズムを実装して高精度KIRタイピングに成功しました。得られたタイピング結果を一部のサンプルで他のシークエンス手法と比較したところ、99%近い精度があることが示されました。
このKIRタイピング手法は非常に有用であるものの、シークエンス技術やコストを考慮すると、疾患とKIR遺伝子型との関係を調べていくのに必要な数十〜数百万人規模に応用することは現実的ではありません。そこで、すでにデータが存在し安価に実施することができる一塩基多型(SNP)タイピングによるマイクロアレイゲノムデータから、KIR遺伝子型を隠れマルコフモデルを用いて推定するインピュテーション法を実装しました。インピュテーションによる推定精度は99.7%と高く、これによりバイオバンク・ジャパンをはじめとするゲノムコホートの17万人を対象としたKIRアレル推定と、85の疾患・バイオマーカーとの関連解析をはじめて実施できました。KIR遺伝子領域は過去に炎症性腸疾患、乾癬や関節リウマチなどの自己免疫疾患との関連が示唆されたことがありましたが、この過去最大規模の解析ではその関連の度合いは報告されていたよりも弱く統計学的に有意と判断されない水準であることがわかりました。
本研究成果が社会に与える影響(本研究成果の意義)
本研究で得られたKIRシークエンス結果から、KIR遺伝子型を決定する解析アルゴリズムを一般公開( https://github.com/saorisakaue/KIR_project )するとともに、日本人集団内での高精度KIR遺伝子型インピュテーション法に使用するための参照配列パネルをNBDC(バイオサイエンスデータベースセンター)にて公開( https://humandbs.biosciencedbc.jp/hum0114-v3 )しており、今後さらに多くのゲノムデータへ応用し、KIR遺伝子とヒトの様々な疾患との関わりを解析する道を開くことができました。感染症・免疫疾患や造血幹細胞移植の成績など、重要な医療データへの更なる応用が期待されます。
なお、本研究は、日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム:B-cureのうち、ゲノム研究バイオバンク(旧:疾患克服に向けたゲノム医療実現プロジェクト(オーダーメイド医療の実現プログラム))、ならびにゲノム医療実現推進プラットフォーム・先端ゲノム研究開発:GRIFIN 「遺伝統計学に基づく日本人集団のゲノム個別化医療の実装」の一環として行われ、文部科学省が推進する新学術領域研究「ゲノム科学の総合的推進に向けた大規模ゲノム情報生産・高度情報解析支援(ゲノム支援)」・「先進ゲノム解析研究推進プラットフォーム(先進ゲノム支援)」および大阪大学大学院医学系研究科バイオインフォマティクス・イニシアティブの協力を得て行われました。
論文情報
【タイトル】 "Decoding the diversity of killer immunoglobulin-like receptors by deep sequencing and a high-resolution imputation method."
【雑誌名】Cell Genomics
【著者名】 Saori Sakaue1-5,*, Kazuyoshi Hosomichi6, Jun Hirata1, Hirofumi Nakaoka7, Keiko Yamazaki8,9, Makoto Yawata10-13, Nobuyo Yawata14, Tatsuhiko Naito1,15, Junji Umeno16, Takaaki Kawaguchi17, Toshiyuki Matsui18, Satoshi Motoya19, Yasuo Suzuki20, Hidetoshi Inoko21, Atsushi Tajima6, Takayuki Morisaki22, Koichi Matsuda23, Yoichiro Kamatani5,24, Kazuhiko Yamamoto25, Ituro Inoue7, Yukinori Okada1,26-29,*.
(* 責任著者)
【所属】
- 大阪大学大学院医学系研究科 遺伝統計学
- 理化学研究所 生命医科学研究センター ゲノム解析応用研究チーム
- ハーバード大学医学部 Center for Data Sciences
- ブリガム&ウィメンズ病院 Divisions of Genetics and Rheumatology
- ブロード研究所 Program in Medical and Population Genetics
- 金沢大学医薬保健研究域医学系 革新ゲノム情報学分野
- 情報・システム研究機構 国立遺伝学研究所 人類遺伝研究部門
- 理化学研究所 生命医科学研究センター 基盤技術開発研究チーム
- 千葉大学大学院医学研究院 人工知能(AI)医学
- シンガポール国立大学 医学部 小児科学
- シンガポール国立大学 Life Sciences Institute
- シンガポール科学技術研究庁 SICS
- 熊本大学国際先端医学研究機構
- 九州大学大学院医学研究院 眼科学
- 東京大学医学部附属病院 脳神経内科
- 九州大学大学院医学研究院 病態機能内科学
- JCHO 東京山手メディカルセンター 消化器内科
- 福岡大学筑紫病院 消化器内科
- JA北海道厚生連 札幌厚生病院 消化器内科
- 東邦大学医学部 内科学講座
- ジェノダイブファーマ株式会社
- 東京大学医科学研究所 癌・細胞増殖部門 人癌病因遺伝子分野
- 東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 クリニカルシークエンス分
- 野東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 複雑形質ゲノム解析分野
- 理化学研究所 生命医科学研究センター 自己免疫疾患研究チーム
- 大阪大学免疫学フロンティア研究センター(IFReC) 免疫統計学
- 大阪大学先導的学際研究機構 生命医科学融合フロンティア研究部門
- 理化学研究所 生命医科学研究センター システム遺伝学チーム
- 大阪大学感染症総合教育研究拠点
用語説明
※1 インピュテーション法
KIR遺伝子型など複雑な遺伝的多型を、参照配列となる周囲の一塩基多型(SNP)と連鎖不平衡関係を用い、隠れマルコフモデルなどの数理モデルを用いて確率的に推測する遺伝統計学手法のこと。
※2 ナチュラルキラー(NK)細胞
ウイルスに対する免疫防御反応や腫瘍免疫に代表される自然免疫機能をになう免疫担当細胞の一種で、細胞傷害性リンパ球に分類される。細胞表面にHLAクラスI分子を認識する受容体群を発現しており、その一つがKIRファミリーである。
※3 HLA
Human leukocyte antigen。ヒトの体の様々な細胞の表面に発現し、生体内における自己と非自己の認識や外来性の病原菌に対する免疫反応を司り、多彩な表現型の個人差を規定している。主に細胞内のタンパク質を提示するクラスIと外来由来のタンパク質を提示するクラスIIの二種類に分類され、KIR遺伝子はクラスI HLA分子を認識している。
※4遺伝子コピー数
通常ヒトの細胞内の遺伝子は父親由来と母親由来の2対(2コピー)であるが、KIRをはじめとする複雑な遺伝子領域では遺伝子の重複や欠失により遺伝子が必ずしも2コピーとはならないことが知られている。たとえばKIR遺伝子領域では遺伝子により0コピーから最大4コピーまでの幅がある。そのコピー数のこと。
※5 バイオバンク・ジャパン
日本人集団約27万人を対象とした生体試料バイオバンクで、東京大学医科学研究所内に設置されている。ゲノムDNAや血清サンプルを臨床情報と共に収集し、研究者へのデータの公開や分譲を行っている。
※6 次世代シークエンサー
この10年ほどで普及したDNAの配列決定手法で、断片化したDNAを大量並列解読することで従来のサンガー法等と比べて高速にゲノム配列を決定することができる。
※7 カーネル密度推定
標本から確率密度関数を推定するノンパラメトリック手法の一つ。今回は各遺伝子のシークエンス深度と基準との比を標本点として確率密度関数を推定することで、各標本点における遺伝子コピー数の推定を実施した。