進化軸情報に基づく化合物生合成遺伝子クラスターの生成的デザイン

研究者紹介

研究代表者
梅村 舞子
京都工芸繊維大学
大学院工芸科学研究科

研究概要

生物のゲノム配列には進化の過程が年輪のように刻まれており、進化の結果形成された、機能する遺伝子クラスター・オペロンの情報が保存・蓄積されている。本研究では、遺伝子機能を単語に見立てて、その集積情報を機械学習の一種である自然言語処理技術によって学習させることで、「より進化した」機能遺伝子クラスターを生成・設計することを目的とする。これにより、劇的に進化を続ける大規模言語処理技術を用いて、生合成遺伝子クラスターの予測だけでなく、望む方向に進化したものを生成する新規プラットフォームを開発する。
生物のゲノム情報は最も蓄積している質の高い生物オミクス情報である。これまでに、公共データベース上の全てのバクテリア・真菌ゲノム情報を用いたゼロショット学習により、十分に高精度な遺伝子機能の集積情報に関する学習モデルの構築に成功しており、現在、構築したモデルに提案させた新規クラスターの化合物生合成能に関する実証実験を行なっている。今後、遺伝子発現、化合物生産性、分子系統樹、化合物構造等による進化軸情報を用いた追学習により、新規遺伝子クラスターの生成モデルを構築・実証する。また、遺伝子クラスターの情報から、目的の機能ドメインを含むタンパク質のアミノ酸配列生成アルゴリズムの開発にも挑戦する。