研究成果

日本人の身長に関わる遺伝的特徴を解明-19万人の解析から日本人の身長に関わる遺伝的要因の謎に迫る-

投稿日:2019/10/02
  • ニュース
  • 研究成果
  • 記者発表

理化学研究所

東京大学大学院新領域創成科学研究科

東京大学医科学研究所

日本医療研究開発機構

理化学研究所(理研)生命医科学研究センターゲノム解析応用研究チームの鎌谷洋一郎客員主管研究員(東京大学大学院新領域創成科学研究科 教授)、秋山雅人客員研究員、久保充明副センター長(研究当時)、東京大学医科学研究所癌・細胞増殖部門人癌病因遺伝子分野の村上善則教授らの共同研究グループ※は、日本人約19万人のゲノム解析を行い、身長に関わる573の遺伝的変異を同定しました。
本研究成果は、日本人の身長の違いに関わる遺伝的・生物学的な特徴の理解に役立つと期待できます。また、今回用いた手法はさまざまな多因子疾患[1]の研究などに応用可能です。

今回、共同研究グループは、これまで多因子形質のゲノム解析において評価が難しかった、日本人の頻度の低い遺伝的変異を精度良く評価できるように、「全ゲノムインピュテーション(全ゲノム予測)[2]」用の参照配列を新たに作成しました。この参照配列を用いて、日本人約19万人の身長に関わる遺伝的要因を「ゲノムワイド関連解析(GWAS)[3]」により調べた結果、573の遺伝的変異を同定しました。また、身長に影響するSLC27A3CYP26B1という二つの遺伝子を新たに特定しました。さらに、低頻度の遺伝的変異は身長を高くさせる傾向にあることを明らかにしました。これは、身長を高くする遺伝的変異が日本人集団では自然淘汰を受けていたことを示唆する結果で、欧米人で検証された結果と真逆であり、高身長が日本人にとって何らかの不利な影響を及ぼしていた可能性を示しています。
本研究は、英国のオンライン科学雑誌『Nature Communications』(9月27日付け)に掲載されました。

 

※共同研究グループ

理化学研究所 生命医科学研究センター
 統計解析研究チーム(研究当時)
   チームリーダー 鎌谷 洋一郎 (かまたに よういちろう)
   (現 ゲノム解析応用研究チーム 客員主管研究員、
    東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 複雑形質ゲノム解析分野 教授)
   リサーチアソシエイト 秋山 雅人  (あきやま まさと)
   (現 ゲノム解析応用研究チーム 客員研究員、
    九州大学大学院医学研究院 眼病態イメージング講座 講師)
   特別研究員(研究当時)石垣 和慶  (いしがき かずよし)
   (現 ゲノム解析応用研究チーム 客員研究員、
    米国ハーバード大学 ポストドクトラルフェロー)
   研修生 坂上  沙央里  (さかうえ さおり)
   研修生 金井 仁弘  (かない まさひろ)
   客員主管研究員 高橋 篤   (たかはし あつし)
   (国立循環器病研究センター研究所 病態ゲノム医学部 部長)
   客員主管研究員 岡田 随象  (おかだ ゆきのり)
   (大阪大学大学院医学系研究科 遺伝統計学 教授)
 基盤技術開発研究チーム
   チームリーダー 桃沢 幸秀  (ももざわ ゆきひで)
 糖尿病・代謝ゲノム疾患研究チーム
   チームリーダー 堀越 桃子  (ほりこし ももこ)
 骨関節疾患研究チーム
   チームリーダー 池川 志郎  (いけがわ しろう)
 統合生命医科学研究センター(研究当時)
   副センター長 久保 充明  (くぼ みちあき)
東京大学
 医科学研究所 癌・細胞増殖部門 人癌病因遺伝子分野
   教授 村上 善則  (むらかみ よしのり)
 新領域創成科学研究科 メディカル情報生命専攻 クリニカルシークエンス分野
   教授 松田 浩一  (まつだ こういち)

※研究支援
本研究は、日本医療研究開発機構(AMED)のオーダーメイド医療の実現プログラム「疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化(研究開発代表者:久保充明)」の支援のもと行われました。

背景

 身長や体重など、遺伝的要因と環境的要因が相互に影響して個人の違いを生じる特徴は「多因子形質」と呼ばれます。身長は、多因子形質の中でも遺伝的な影響が強いことが知られており、欧米人の双子を用いた研究では、身長の個人差の8割程度は遺伝的要因によって生じていると報告されています(注1)。
 多因子形質の原因の特定には、2002年に理研が世界に先駆けて報告(注2)した「ゲノムワイド関連解析(GWAS)」というゲノム上の遺伝的変異を網羅的にスクリーニングする方法が主に用いられています。鎌谷客員主管研究員らはこれまでにGWASにより、日本人の肥満(注3)や臨床検査値(注4)、喫煙(注5)などの多因子形質について報告してきました。

 しかし、これまでに実施したGWASでは、日本人で比較的よく見られる塩基の違いについてのみ調べており、頻度が低い遺伝的変異については、精度が低く十分な検討ができませんでした。また、これまでの身長に関係する遺伝的要因の大規模な検索は、欧米人を中心としたものであり、日本人を対象とした研究は小規模なものに限られていました(注6)。
 そこで、共同研究グループは、日本人の頻度の低い遺伝的変異を精度良く評価することを試み、多因子形質の一つである身長に関連するものを検索しました。

 

(注1)Peter M. Visscher et al. Five Years of GWAS Discovery. Am. J. Hum. Genet 90, 7-24 (2012).
(注2)Ozaki, K. et al. Functional SNPs in the lymphotoxin-α gene that are associated with susceptibility to myocardial infarction. Nat. Genet. 32, 650?654 (2002).
(注3)Akiyama, M. et al. Genome-wide association study identifies 112 new loci for body mass index in the Japanese population. Nat. Genet. 49, 1458?1467 (2017).
(注4)Kanai, M. et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nat. Genet. 50, 390?400 (2018).
(注5)Matoba, N. et al. GWAS of smoking behaviour in 165,436 Japanese people reveals seven new loci and shared genetic architecture. Nat. Hum. Behav. 3, 471-477 (2019).
(注6)Okada, Y. et al. A genome-wide association study in 19 633 Japanese subjects identified LHX3-QSOX2 and IGF1 as adult height loci. Hum. Mol. Genet. 19, 2303?2312 (2010).

研究手法と成果

 「全ゲノムインピュテーション(全ゲノム予測)」は、実験で測定されていない遺伝的変異を推定する遺伝統計学的手法です。GWASを行う際に、実験で測定された遺伝子変異だけを用いると、数十万カ所の遺伝的変異しか比較できませんが、全ゲノムインピュテーションを行うと、比較できる遺伝的変異の数を数千万カ所にも増やすことができます。
 共同研究グループは、まず全ゲノムインピュテーションの精度を改善するために、バイオバンク・ジャパン[4]で実施された日本人1,037人の全ゲノムシークエンスデータ(注7)と国際プロジェクトの1,000ゲノムプロジェクト(注8)で実施されたさまざまな人種を対象とした2,504人の公開されている全ゲノムシークエンスデータを統合し、日本人の全ゲノムインピュテーション用の参照配列を新たに構築しました。
 そして、バイオバンク・ジャパンの参照配列に用いたサンプルとは別のサンプルで精度を検証したところ、既存の参照配列と比較して高精度に遺伝的変異を推定できることを確認しました(図1)。特に、アレル頻度[5]が低い遺伝的変異においては、精度が著しく向上していました。

図1 全ゲノムインピュテーションの精度
今回構築した全ゲノムインピュテーション用参照配列(赤)、統合前の日本人の全ゲノムシークエンスデータの参照配列(青)、1000ゲノムプロジェクトの公開データの参照配列(水色)、1000ゲノムプロジェクトの東アジア人データの参照配列(緑)でインピュテーションした結果について、横軸にアレル頻度、縦軸にその精度を示した。アレル頻度が5%を超えたところでは大きな差は見られないが、それ未満の低アレル頻度の遺伝的変異は今回の参照配列を用いた方が高いことが分かる。

 次に、作成したインピュテーション参照配列を用いて、バイオバンク・ジャパンに参加した159,195人を対象に、約2800万カ所の遺伝的変異が身長に及ぼす影響についてGWASを実施しました。その結果、363のゲノム領域に存在する609の遺伝的変異がゲノムワイド水準(P = 5.0 x 10-8)[6]を超えており、身長に関わることが分かりました。さらに、同定された遺伝的変異の再現性について検証するために、日本の四つの研究に参加した32,692人について同様の解析を行った結果、609のうち573の遺伝的変異が日本人の身長に関わることが分かりました(図2)。このうち64の遺伝的変異はアレル頻度が5%未満であり、これまでの方法では検出が難しいものでした。

図2 同定した遺伝的変異のアレル頻度とその身長への影響
本研究で同定された遺伝的変異について、横軸にアレル頻度、縦軸にその影響をプロットした。一つの塩基の違いで、身長が2 cm近く高くなったり低くなったりすることに影響を与える遺伝的変異が同定された。

 ただし、発見されたそれぞれの領域には複数の遺伝子が存在しているため、どの遺伝子が身長の違いに影響しているかまでは判定することができません。そこで、タンパク質に影響する遺伝的変異の情報を用いて遺伝子単位で関連を調べる手法により、どの遺伝子が身長へ影響しているかを検証しました。その結果、CYP26B1SLC27A3というニつの遺伝子が身長に影響していることが明らかになりました(図3)。興味深いことに、これらの遺伝子の遺伝的変異は、いずれも身長を高くすることに関わっていると推察されました。
 また、CYP26B1遺伝子とSLC27A3遺伝子が他の形質にどのように影響するかを、バイオバンク・ジャパンのデータを用いて解析したところ、CYP26B1遺伝子は肥満の指標であるBMI [7]に影響すること、SLC27A3遺伝子はコレステロールや中性脂肪に影響することが判明しました。つまり、それぞれ別の生物学的機序により身長に影響する可能性が示されました。

図3 遺伝子レベルの関連解析
遺伝子ごとの身長の関連について網羅的に検討を行った。図では一つの点が遺伝子を意味しており、横軸に染色体上の位置、縦軸に遺伝子の関連の強さを示している。CYP26B1遺伝子とSLC27A3遺伝子が身長に影響していることが分かった。

 さらに、GWASの結果に基づいたgene-set enrichment解析[8]や、アレル頻度別に遺伝的変異が身長に及ぼす影響について検証を行ったところ、欧米人の結果と類似した結果が得られたことから、身長に関わる遺伝的要因の生物学的・遺伝的特徴は人種を超えて共通していることが確認されました。
 最後に、アレル頻度が低い遺伝的変異の影響に着目し、日本人の身長に関わる遺伝的要因がどのような影響を受けてきたかを調べました。遺伝的変異をアレル頻度に従って100種に分け、それぞれの身長へ与える影響の平均値を調べたところ、アレル頻度が低い遺伝的変異では身長を高くする傾向にあることが分かりました(図4)。この結果は、身長を高くする効果を持った遺伝的変異が日本人集団では自然淘汰を受けていたことを示唆する結果であり、高身長が日本人にとって何らかの不利な影響を及ぼしていた可能性を示しています。

図4 アレル頻度と身長に及ぼす効果量の関係
ゲノムワイド関連解析で得られた遺伝的変異の身長への影響について、アレル頻度順に100に分割し検証した。X軸は、常用対数スケールのアレル頻度の平均、Y軸は効果サイズの平均(遺伝的変異の身長に及ぼす影響の平均)を示している。アレル頻度が低い遺伝的変異は、身長を高くする傾向を示す。

(注7)Okada, Y. et al. Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese. Nat. Commun. 9, 1631 (2018).
(注8)1000 Genomes Project Consortium. A global reference for human genetic variation. Nature 526, 68?74 (2015).

今後の期待

 本研究成果は、身長に関する遺伝的要因の人種差の理解や生物学的機序の解明に貢献すると考えられます。
 また、今回開発した日本人の全ゲノムインピュテーション用の参照配列は、バイオサイエンスデータベースセンター(NBDC)と国立遺伝学研究所 DNA Data Bank of Japan (DDBJ)センターが運営するJapanese Genotype-phenotype Archive(JGA)より公開される予定です。また、GWASの結果は、NBDCと理研が独自に構築した日本人集団ゲノム関連解析情報データベース「Jenger」より公開される予定です。これらのデータ公開により、さらなる研究成果につながることが期待できます。

論文情報

<タイトル>
Characterizing rare and low-frequency height-associated variants in the Japanese population
<著者名>
Masato Akiyama, Kazuyoshi Ishigaki, Saori Sakaue, Yukihide Momozawa, Momoko Horikoshi, Makoto Hirata, Koichi Matsuda, Shiro Ikegawa, Atsushi Takahashi, Masahiro Kanai, Sadao Suzuki, Daisuke Matsui, Mariko Naito, Taiki Yamaji, Motoki Iwasaki, Norie Sawada, Kozo Tanno, Makoto Sasaki, Atsushi Hozawa, Naoko Minegishi, Kenji Wakai, Shoichiro Tsugane, Atsushi Shimizu, Masayuki Yamamoto, Yukinori Okada, Yoshinori Murakami, Michiaki Kubo and Yoichiro Kamatani
<雑誌>
Nature Communications
<DOI>
10.1038/s41467-019-12276-5

補足説明

[1] 多因子疾患
環境要因と遺伝的要因とが合わさって発症する疾患。糖尿病、高血圧、リウマチ、痛風、高脂血症、悪性腫瘍など日常的にみられる多くの疾患が該当する。

[2] 全ゲノムインピュテーション(全ゲノム予測)
DNAマイクロアレイで一部(数十万から数百万カ所)の遺伝型を測定した後に、そこで得られた遺伝型を用いて実験的に測定していない遺伝的変異をコンピュータで推定し、補完する遺伝統計学的手法。被検者の全ゲノムシークエンス解析を行う必要がなく、時間・費用が抑えられるというメリットがある。この手法では、全ゲノムシークエンスデータを参照して推定を行うが、研究グループは精度改善を目的に、今回日本人の全ゲノムシークエンスデータを用いた参照配列を新たに構築した。

[3] ゲノムワイド関連解析(GWAS)
疾患や身長・体重などの量的な形質に影響があるゲノム上のマーカー(遺伝的変異)を、網羅的に検索する手法。2002年に、理研が世界に先駆けて報告を行っており、以降、さまざまな疾患や量的形質に関連するゲノムマーカー同定に貢献している。GWASはGenome-Wide Association Studyの略。

[4] バイオバンク・ジャパン
アジア最大規模の生体試料バンクで、東京大学医科学研究所内に設置されている。オーダーメイド医療の実現プログラムの基盤であり、20万人を超える日本人から収集したDNAや血清サンプルを臨床情報とともに厳重に保管し、研究者への試料やデータの提供を行っている。

[5] アレル頻度
個々のヒトゲノムを比較すると、染色体上の場所が同一であっても、遺伝子や個々の塩基配列が異なる場合がある。これらの遺伝子や塩基配列を、アレルという。例えば、ある染色体上の位置において、個人によりAA/AG/GGのどれかの塩基配列を持つ場合、集団の中でのA(アデニン)やG(グアニン)の頻度をアレル頻度という。

[6] ゲノムワイド水準(P = 5.0 x 10-8
通常の解析の有意水準は、0.05未満を使用する。これは関係がない確率が5%未満という意味であり、100個のSNPを調べると全く関係がなくても偶然に5個(5%)は関係があると誤って判断されてしまう可能性がある(偽陽性)。そこでゲノムワイド関連解析では、通常の判定基準である0.05をさらに100万で割った5×10-8未満という厳しい判定基準を採用して、誤った判断をしないように独自に水準を設定している。

[7] BMI
世界的に広く用いられている肥満を表す指標。BMI=体重(kg)÷{身長(m)×身長(m)}で表される。日本では、BMI25以上が肥満とみなされる。BMIはBody Mass Indexの略。

[8] gene-set enrichment解析
GWASの結果に基づいて、遺伝子にスコアをつけ、スコアが高い遺伝子が特定の機能を持った遺伝子に集積しているかを検討する解析手法。