人工知能(AI)を活用したタンパク質構造の予測。/米ワシントン大学生化学科のデービッド・ベイカー教授の研究チーム

人工知能(AI)が予測して吐き出すタンパク質の3次元構造データが爆発的に増え、データは溢れる一方で解釈が追いつかないボトルネックが拡大している。この中で韓国の研究チームが数十万個のタンパク質構造を一度に高速かつ精密に整列して比較できる多重アラインメントソフトウエアを開発した。

科学技術情報通信部はマーティン・シュタイネガー(Martin Steinegger)ソウル大学生命科学部教授の研究チームが、大規模タンパク質構造ビッグデータを基盤とした超高速・高精度の多重アラインメント解析技術「フォールドメイソン(FoldMason)」を開発したと30日明らかにした。今回の研究成果は国際学術誌「サイエンス」に同日掲載された。

タンパク質はアミノ酸配列が複雑に折りたたまれて形成される3次元構造を通じて生命現象を起こす。例えば酵素作用、免疫反応、細胞シグナル伝達など疾病・老化に関わる多様な機能がタンパク質構造と結びついている。したがってタンパク質構造がどのように進化してきたかを理解することは、疾病の原因を明らかにし新たな治療戦略を探るうえで重要である。近年はAI基盤のタンパク質構造予測技術が急速に発展し、膨大なタンパク質構造データが蓄積されている。

しかし一部ではデータは増えたものの、比較・解釈が追いつかないとの指摘が出ている。特にタンパク質を比較する際、アミノ酸配列の類似度が極めて低く、従来の方法では進化的関係を判別しにくい「トワイライトゾーン」区間が残っていた。

研究チームはこの限界を越えるため、タンパク質の3次元構造とアミノ酸配列情報を統合的に解析しつつ速度を高めたソフトウエア、フォールドメイソンを開発した。一度に複数のタンパク質をアラインし、タンパク質全体で共通に維持されるコア構造を見出して進化過程の推定を支援する方式である。

フォールドメイソンは従来のアプローチに比べ速度が約100〜1000倍速い一方で高い精度を示した。その結果、数十万個のタンパク質構造を一括で比較・アラインできた。研究チームは、解析が難しかったトワイライトゾーンを含め、ほぼすべてのタンパク質の解析に活用できると説明した。

シュタイネガー教授はChosunBizに「研究過程で最も難しかった部分は、精度とスケール(拡張性)を同時に満たすことだった」と述べ、「タンパク質は可塑的に動くことができ、中間に挿入・欠失が生じたり長さも変わる。こうした対象を精緻かつ高速にアラインすることは全く別次元の挑戦だった」と語った。

実際に研究チームはフォールドメイソンを用いた解析で、人間と細菌のように進化的に遠く離れた生物間でも、ウイルスに対抗する中核タンパク質の基本設計が数十億年にわたり大きく変わらず維持されてきた手掛かりを確認した。これは人体の免疫システムがどのような過程を経て形成されたのかを理解するうえで重要な糸口となり得る。

シュタイネガー教授は「フォールドメイソンを活用すれば、膨大なタンパク質の進化関係を解析し、構造差を疾病メカニズムと関連づけて潜在的な創薬標的を探すことにも役立てられる」とし、「今後は生物学者が活用できるよう、構造変異を解釈する機能を強化し、得られた結果を進化解析、疾病関連変異情報と結びつけていく」と明らかにした。

参考資料

Science(2026)、DOI: https://doi.org/10.1126/science.ads6733

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。