ライフサイエンス新着論文レビュー

HLA imputation法を用いたバセドウ病のバイオマーカーの同定

岡田 随象
(東京医科歯科大学大学院医歯学総合研究科 疾患多様性遺伝学分野)
email:岡田随象
DOI: 10.7875/first.author.2015.081

Construction of a population-specific HLA imputation reference panel and its application to Graves' disease risk in Japanese.
Yukinori Okada, Yukihide Momozawa, Kyota Ashikawa, Masahiro Kanai, Koichi Matsuda, Yoichiro Kamatani, Atsushi Takahashi, Michiaki Kubo
Nature Genetics, 47, 798-802 (2015)




要 約


 ヒトの第6染色体の短腕のMHC領域に存在するHLA遺伝子は多彩な疾患に対する発症リスクをもつ.HLA imputation法は個人のHLA遺伝子型をコンピューターにより高い精度で推定する遺伝統計解析の手法であり,HLA遺伝子のもつ発症リスクの網羅的な解析を可能にする.この研究においては,HLA imputation法の実施に必要となる参照遺伝子型データを日本人の集団908名を対象に作成し,日本人の集団に対しHLA imputation法を実装した.ハプロタイプの頻度分布のもつ情報量エントロピーに対する正規化の指標を用いてHLA遺伝子のあいだの連鎖不平衡関係を数値化する手法を導入し,高次元でのデータの可視化の手法とともにHLA遺伝子型データを評価した結果,日本人の集団においてはMHC領域の全域にわたる人種に特異的なHLA遺伝子型のハプロタイプが存在し,HLA遺伝子のあいだに比較的強固な連鎖不平衡関係のあることが明らかにされた.さらに,日本人の集団9003名を対象としたバセドウ病のゲノムワイド関連解析データへのHLA imputation法の適用をつうじて,複数のHLA遺伝子にコードされたアミノ酸配列をバセドウ病に対する発症リスクをもつバイオマーカーとして同定した.

はじめに


 ヒトの第6染色体の短腕に存在するMHC(major histocompatibility complex,主要組織適合遺伝子複合体)領域は,約4 Mbpという短い距離に200以上の遺伝子が含まれる複雑な領域であり,自己免疫疾患,アレルギー性疾患,感染症,精神疾患,悪性腫瘍,薬剤への副作用といった多彩な疾患に対する発症リスクをもつ領域として知られている1).なかでも,MHC領域に存在するHLA(human leukocyte antigen,ヒト白血球型抗原)遺伝子は発症リスクをもつ責任感受性遺伝子と考えられている.HLA遺伝子は白血球の細胞表面に発現し抗原に特異的な免疫反応をつかさどる機能性遺伝子である.HLA遺伝子には複数の種類が存在し,主要なものはクラスI HLA遺伝子とクラスII HLA遺伝子の2つに大別される.おのおののHLA遺伝子は数十種類から百種類のもの遺伝子配列パターンの個人差をもち,この複数のHLA遺伝子型の組合せが個人の発症リスクを規定していると考えられている.HLA遺伝子型は一般的なゲノム塩基配列の個人差であるSNP(single-nucleotide polymorphism,1塩基多型)と比較して高い発症リスクをもつ例が多いため,ゲノム情報にもとづく個別化医療の実現においても実用性が高いと期待されている.

1.MHC領域における発症リスクのファインマッピングとHLA imputation法


 しかしながら,どのHLA遺伝子の,どのHLA遺伝子型が,どの程度の発症リスクをもつのかを具体的に決定するファインマッピングは,1)複数のHLA遺伝子が近接して位置しているため,個別のHLA遺伝子ではなく複数のHLA遺伝子を同時に解析する網羅的な研究が必要であること,2)おのおののHLA遺伝子が数十種類から百種類もの多型をもつため,統計解析手法が難解であること,3)HLA遺伝子型を実験的に決定するための費用は高額であるため,大量の試料の解析がコストの面から困難であることから,進んでいなかった.この状況を打破するために開発されたのがHLA imputation法である.HLA imputation法とは,HLA遺伝子型をコンピューターにより高い精度で推定することにより,HLA遺伝子型を実験的に決定することなくMHC領域のファインマッピングを可能にする遺伝統計解析の手法である2,3).まず,一般の集団を対象として,MHC領域においてSNPデータおよびHLA遺伝子型を実験的に決定する.得られた遺伝子型データを機械学習における参照データとして用いることにより,そのほかの試料においてゲノムワイド関連解析をつうじて得られているMHC領域のSNPデータを対象として,HLA遺伝子型を統計学的に推定(imputation)する.ゲノムワイド関連解析データがすでに存在している場合,“追加の費用なし”でHLA遺伝子型の情報が網羅的に得られることが特徴である.とくに,古典的なHLA遺伝子の対立遺伝子にくわえHLA遺伝子のアミノ酸多型のimputationも実装されたSNP2HLAソフトウェアが開発されたことにより,HLA遺伝子型のファインマッピングの実施が可能になった2,3)
 HLA imputation法はMHC領域に発症リスクをもつ疾患において多大な成果をあげている.現在,HLA imputation法を用いたMHC領域のファインマッピングが欧米人の集団を中心に多く実施されており,HLA遺伝子型が多彩な疾患におけるバイオマーカーとして報告されている4,5)

2.日本人の集団におけるHLA imputation法の実装


 HLA imputation法はMHC領域における発症リスクのファインマッピングにおいて有用な手段であるが,実施にあたっては参照データとなる遺伝子型データの事前の構築が必要である.日本人の集団においてはこの参照遺伝子型データが存在しないためHLA imputation法が実施できない状況がつづいていた.そこで,日本人の集団におけるHLA imputation法の実装を目的として,日本人の健常者の集団908名を対象に参照遺伝子型データを構築した.複数の商用マイクロアレイを用いたMHC領域のSNPの高密度での遺伝子型タイピングにくわえ,3つのクラスI HLA遺伝子および4つのクラスII HLA遺伝子のHLA遺伝子型を実験的に決定した.
 構築された参照遺伝子型データを用いて,すでにHLA遺伝子型の知られている日本人の試料のデータに対しHLA imputation法を実施したところ,平均で90~95%の正答率という高い精度でHLA遺伝子型を推定できた.また,欧米人の集団や日本人以外の東アジア人の集団を対象として構築された参照遺伝子型データを用いた場合と比べ,高い正答率が得られた.以上より,日本人の集団へのHLA imputation法の実施に際して,日本人の集団に特異的な参照遺伝子型データが有用であることが示された.HLA imputation法の実施における人種に特異的な参照遺伝子型データの必要性についてはさまざまな議論があったが,この研究により一定の結論が得られた.

3.ビッグデータの可視化の手法を用いたHLA遺伝子の多型構造の人種のあいだでの比較


 なぜ人種に特異的な参照遺伝子型データが必要なのだろうか? その答えを得るべく,集団において複雑な分布をとるHLA遺伝子型の組合せの統合的な比較を可能にする,2つのビッグデータの可視化の手法を開発した.ひとつは,遺伝子多型の連鎖不平衡関係を数値化する指標であるεの導入である6,7).εは遺伝子型の組合せ(ハプロタイプ)の集団における頻度の情報に対する情報量エントロピーを正規化した指標である.元来は複数のSNPのあいだの連鎖不平衡関係を検討するために開発された指標であったが,この研究においては,2つのHLA遺伝子型の連鎖不平衡関係の検討へと適用を拡大した.今回,構築された日本人の集団の参照遺伝子型データを対象に,おのおののHLA遺伝子のペアのあいだのεを計算した結果,隣接するHLA遺伝子の一部で強固な連鎖不平衡関係が認められた.東アジア人の集団および欧米人の集団における参照遺伝子型データについても検討したところ,日本人の集団ではとくにこれらのHLA遺伝子のあいだの連鎖不平衡関係が強固であることが明らかにされた.
 もうひとつは,多次元のビッグデータを2次元の情報に圧縮し可視化するツールDisentanglerの導入である8).Disentanglerは多彩な高次元のデータへの適用が可能であるが,遺伝子型データに適用した場合は集団における複雑なハプロタイプの分布の可視化が可能になることが知られている8).Disentanglerを参照遺伝子型データに適用した結果,日本人の集団においてはMHC領域の全域にわたる長いHLA遺伝子型のハプロタイプが高い頻度で存在することが明らかにされた.このHLA遺伝子型のハプロタイプは日本人の集団においてのみ特異的にみられ,日本人の集団におけるHLA遺伝子のあいだの比較的強固な連鎖不平衡関係の一因と考えられた.このように,ビッグデータの可視化の手法をつうじ,日本人の集団におけるHLA遺伝子型の特徴および人種のあいだの違いが明らかにされた.

4.HLA imputation法によるバセドウ病のバイオマーカーの同定


 バセドウ病は甲状腺ホルモンを産生する臓器である甲状腺の機能が異常に亢進することにより生じる自己免疫疾患である.甲状腺ホルモンは身体の新陳代謝の維持に関与するため,甲状腺の機能の亢進は体重の減少,疲労,眼球の突出といった症状を生じる.青年期の女性を中心に人口の約0.5%が発症する“ありふれた疾患”のひとつである.以前より,HLA遺伝子型がバセドウ病の発症に関与することが報告されていたが,原因となるHLA遺伝子型は詳細には解明されていなかった.
 そこで,バセドウ病の患者1956名および非患者7047名に対して実施されたゲノムワイド関連解析データに対し,今回,作成された参照遺伝子型データを用いてHLA imputation法を適用した.その結果,複数のクラスI HLA遺伝子およびクラスII HLA遺伝子にコードされたアミノ酸配列の多型により,バセドウ病の発症リスクが規定されていることが明らかにされた(図1).もっとも強い発症リスクを示したのはHLA-DPB1遺伝子にコードされた35番目のアミノ酸残基で,この残基がPheからLeuに変異している場合にはバセドウ病を1.4倍ほど発症しやすくなることが判明した.同定されたアミノ酸残基は,いずれのHLA分子においても抗原ペプチドの提示にかかわる機能的な部位に位置しており,バセドウ病の病態における抗原の提示を介したHLA遺伝子の機能的な寄与が示唆された.




おわりに


 ヒトのゲノム解析の分野における長年の課題であった発症リスクとなるHLA遺伝子型の詳細な同定がHLA imputation法の導入により解決しつつある.この研究をつうじ,日本人の集団に対してもHLA imputation法の適用が可能になったことにより,発症リスクとなるHLA遺伝子型のよりいっそうの同定が期待される.一方で,HLA imputation法により得られるのはあくまで推定されたHLA遺伝子型であり,一部のまれなHLA遺伝子型については推定の精度が低くなることが知られている2).将来的には,次世代シークエンサー技術を用いて安価かつ正確に個人のHLA遺伝子型を決定できるようになることが望ましいと考えられる9)
 この研究において作成された日本人の集団の参照遺伝子型データはバイオサイエンスデータベースセンターのNBDCヒトデータベースから公開しており(http://humandbs.biosciencedbc.jp/hum0028-v1),より多くの方々に活用してほしい.

文 献



  1. de Bakker, P. I. & Raychaudhuri, S.: Interrogating the major histocompatibility complex with high-throughput genomics. Hum. Mol. Genet., 21, R29-R36 (2012)[PubMed]

  2. Jia, X., Han, B., Onengut-Gumuscu, S. et al.: Imputing amino Acid polymorphisms in human leukocyte antigens. PLoS One, 8, e64683 (2013)[PubMed]

  3. Raychaudhuri, S., Sandor, C., Stahl, E. A. et al.: Five amino acids in three HLA proteins explain most of the association between MHC and seropositive rheumatoid arthritis. Nat. Genet., 44, 291-296 (2012)[PubMed]

  4. Okada, Y., Han, B., Tsoi, L. C. et al.: Fine mapping major histocompatibility complex associations in psoriasis and its clinical subtypes. Am. J. Hum. Genet., 95, 162-172 (2014)[PubMed]

  5. Okada, Y., Kim, K., Han, B. et al.: Risk for ACPA-positive rheumatoid arthritis is driven by shared HLA amino acid polymorphisms in Asian and European populations. Hum. Mol. Genet., 23, 6916-6926 (2014)[PubMed]

  6. Nothnagel, M., Furst, R. & Rohde, K.: Entropy as a measure for linkage disequilibrium over multilocus haplotype blocks. Hum. Hered., 54, 186-198 (2002)[PubMed]

  7. Nothnagel, M. & Rohde, K.: The effect of single-nucleotide polymorphism marker selection on patterns of haplotype blocks and haplotype frequency estimates. Am. J. Hum. Genet., 77, 988-998 (2005)[PubMed]

  8. Kumasaka, N., Nakamura, Y. & Kamatani, N.: The textile plot: a new linkage disequilibrium display of multiple-single nucleotide polymorphism genotype data. PLoS One, 5, e10207 (2010)[PubMed]

  9. Hosomichi, K. Jinam, T. A., Mitsunaga, S. et al.: Phase-defined complete sequencing of the HLA genes by next-generation sequencing. BMC Genomics, 14, 355 (2013)[PubMed]





著者プロフィール


岡田 随象(Yukinori Okada)
略歴:2011年 東京大学大学院医学系研究科 修了,同年 同 研究員,2012年 米国Harvard大学 研究員を経て,2013年より東京医科歯科大学大学院医歯学総合研究科 講師.
研究テーマ:遺伝統計解析をつうじたヒトの疾患の病態の解明やゲノム創薬への貢献.
抱負:遺伝統計学の楽しさを日本中に広めたい.

© 2015 岡田 随象 Licensed under CC 表示 2.1 日本