banner

ニュース

Nov 03, 2023

CMUの研究者が開発した機械学習手法が進化の基本的な側面を明らかにする

カーネギーメロン大学計算生物学部(新しいウィンドウで開きます) (CBD) の研究者チームは、種の特定の形質がどのように進化したかを理解するために重要なゲノムの部分を特定する新しい方法を開発しました。

この研究は、Science(新しいウィンドウで開きます)に掲載され、コンピューターサイエンス学部助教授のアンドレアス・フェニング(新しいウィンドウで開きます)が主導し、動物の全ゲノムを解読する取り組みであるズーノミアプロジェクト(新しいウィンドウで開きます)に貢献しています。 240 匹の哺乳類を対象に、人間の健康の保護と生物多様性の保全に重要な意味を持つ遺伝子と形質の基本的な側面に光を当てます。 これらの新しい大規模なデータセットを理解するには、最新の人工知能 (AI) および機械学習 (ML) テクノロジーが必要です。

コードDNAとして知られるゲノムの特定の部分は、細胞機能の不可欠な調節因子であるタンパク質を生成するための指示を提供します。 時間の経過とともに、コーディング DNA がタンパク質生成に与える指示にわずかな違いが生じ、それが進化の原動力の 1 つになります。

しかし、これらのタンパク質を生成する DNA 断片は、ヒトゲノムを構成する 30 億のヌクレオチド対のわずか 1% にすぎません。 エンハンサーとして知られる他の非コード DNA 領域は、特定の遺伝子がいつ、どこで活性化するかを決定します。 CMU チームは、これらの領域がどのように機能するかをさらに学ぶために、Tissue-Aware Conservation Inference Toolkit (TACIT) と呼ばれる ML アプローチを作成しました。 従来の進化モデルでは、遺伝子群における一連の突然変異による種の脳サイズの変化が実証される可能性がありますが、エンハンサーは遺伝子をオンまたはオフにするだけで同じ結果が得られる可能性があります。

哺乳類の進化に関するほとんどの研究は、何百万年にもわたって比較的わずかしか変化していないゲノムの部分に焦点を当てています。 これらの保存された領域、特に遺伝子は、個々の種の固有の特性を強調する哺乳類 DNA の基本的な要素についての洞察を提供します。

フェニング氏と彼のチームにとっての課題は、時間の経過とともに、DNA エンハンサー領域の配列は変化するが、機能は変化しない可能性があることです。 たとえば、よく研究されている膵島エンハンサー(新しいウィンドウで開きます)は、7億年以上の進化にもかかわらず、ヒト、マウス、ゼブラフィッシュ、カイメンの遺伝子レベルを同様のパターンで制御しています。 このため、個々のヌクレオチドを検査する従来の方法を使用してそれらを特定し追跡することがはるかに困難になります。

TACIT は、エンハンサーが特定の細胞型または組織で活性化するかどうかを正確に予測することで、この問題に対処します。 これにより、科学者は新たな実験室実験を行うことなく、新たに配列決定されたゲノム内のこれらの重要なエンハンサー領域を特定することができ、保全生物学における潜在的な応用が可能になります。 このツールキットは、管理された実験室実験が不可能な、絶滅危惧種または絶滅危惧種においてエンハンサーがどのように機能するかを予測できます。

「TACITは、バンドウイルカや絶滅危惧種のクロサイなど、一次組織サンプルを入手できない種の遺伝子以外のゲノム部分の機能を予測する前例のない機会を提供します」と論文の筆頭著者であるアイリーン・カプロウ氏は述べた。この論文の著者であり、CBD の博士研究員およびレーンフェローでもあります。 「ML 手法と特定の細胞型からエンハンサーを同定する手法が向上するにつれて、TACIT の機能を拡張して哺乳類の進化に関する新しい種類の洞察を提供できるようになると期待しています。」

240 匹の哺乳類のゲノム配列の機能を予測した後、研究チームは TACIT を適用して哺乳類の中でより大きな脳に進化したゲノムの部分を特定し、それらの部分はヒトの脳に突然変異が関係している遺伝子の近くにある傾向があることを発見しました。サイズ障害。 彼らはまた、特定のニューロンのサブタイプであるパルブアルブミン陽性抑制性介在ニューロンに特異的な、哺乳類全体の社会的行動に関連するエンハンサーを特定した。

「これは氷山の一角にすぎないと考えています」と研究の主著者であるフェニング氏は言う。 「少数の組織と少数の形質に TACIT を適用することで、興味深い関係性を発見しましたが、発見すべきことはまだたくさんあります。」

フェニング氏とカプロー氏に加えて、この論文の主著者には、元生物科学博士のアリッサ・ローラー氏が含まれています。 現在ブロード研究所の学生。 そしてダニエル・シェイファーはCBDの学部プログラムを最近卒業したばかりです。 シェーファー氏がこの出版物の共同筆頭著者であることは、最先端の計算技術に焦点を当て、実践的な科学研究の機会を重視する学部プログラムの革新的なカリキュラムを示す重要な証拠です。

ズーノミア プロジェクトの詳細については、その Web サイト (新しいウィンドウで開きます) をご覧ください。

投稿者: Name Aaron Aupperlee
共有