機械学習を利用した天然化合物生合成遺伝子クラスターの進化的デザイン

研究者紹介

研究代表者
梅村舞子
産業技術総合研究所
生命工学領域

研究概要

 生物のゲノム配列には進化の過程が年輪のように刻まれており、進化の結果形成された機能する遺伝子クラスター・オペロンの情報が保存・蓄積されている。本研究計画では、遺伝子機能を単語に見立てて、その並びを機械学習の一種である自然言語処理技術によって学習させることで、最小限・最適な機能遺伝子クラスターを設計する技術を開発する。設計した遺伝子クラスターを大腸菌・糸状菌に異種発現させて結果を検証する。これにより、これまで実験による試行錯誤に大きく依存していた、ターゲット化合物の生合成に必要な最小限・最適な機能遺伝子セットのデザインを可能にすることで、迅速かつ効率的な天然有機化合物生産を加速し、新規化合物の創出に寄与する。

 研究開発は、真核・原核微生物や植物等を対象として、ゲノム情報からの遺伝子クラスター予測と、追学習した改良モデルによる遺伝子クラスター設計の2段階に分けて進める。始めにテルペンやポリケチド等の代表的な既知生合成系を対象としてモデル構築するが、本技術では原理的に遺伝子クラスター・オペロンを形成するあらゆる種類の反応系を検出・設計できるため、全く新しい反応系が見つかる可能性もある。得られた予測・設計クラスターを領域内の様々な種類の天然化合物を対象とする他の研究者に提供することで、本領域が目指す天然化合物に関連する反応のレパートリーを増やし、設計の自由度を高めることに貢献する。