研究の紹介

  • 尾形ラボでは、バイオインフォマティクスを使って、すべての生物やウイルスの遺伝子のビッグデータを解析しています。
  • 特に、ネットワーク解析を武器にして配列相同性解析に取り組んでいます。
  • 最近は、全生物およびウイルスを対象としたGcornデータベースの構築に集中しています。

★ 最近のニュース

  • Gcornデータベースのウイルス版のGcorn viralを、新型コロナウイルスの感染状況のデータ解析に関して、緊急に公開しました(2020-04-22)。
  • Gcorn plantがPlant Physiology誌に掲載されましたPubMedへのリンク

★ バイオインフォマティクスとは

  • 生命科学情報科学を融合した学問です。
  • 生命科学の情報がビッグデータ化してきたので、情報科学の専門的なアプローチが必要になってきました。
  • データサイエンスとも呼ばれます。
  • 高校で、生物数学が得意だった人、特に確率・統計が好きだった人に向いています。

★ バイオデータベース

  • バイオデータベースとは、生命情報をまとめたデータを公開しているウェブサイトです。
  • 尾形ラボでは、各種のバイオデータベースを公開しています(ロゴをクリックすると、データベースに飛びます)。
  • 遺伝子のアミノ酸配列が似ているものを調べるためのデータベースです。現在は植物版(Gcorn plant)と菌類版(Gcorn fungi)を公開しています。
  • 2019年度版に更新しています。
  • アミノ酸配列が似ていることから、遺伝子の機能や進化の過程を予想することができます。
  • また、アミノ酸や塩基配列には、遺伝子の進化に伴う情報が残されていると考えられます。そうした遺伝子の進化の情報を生物界全体で明らかにしたいと考えています。
  • これから、原生動物(G. protozoa)、無脊椎動物(G. invertebrate)、哺乳類(G. mammalian)の順に公開していきます。
  • ウイルス版(G. viral)とバクテリア版(G. bacteria)の公開も急いで進めています。
  • 特に、ウイルス版については、新型コロナウイルスやインフルエンザウイルスの変異に対してGcornデータベースのアプローチが有効だと考えています。
  • 遺伝子の発現量を調べるためのデータベースです。マイクロアレイや次世代シーケンサーで調べたデータを扱っています。
  • 遺伝子がどのような組織で発現しているか、またどのような条件で発現しているかを調べることができます。
  • Gcornデータベースと連携することで、他の植物の遺伝子との関わりを調べることができると考えています。
イヌの腸内フローラの公開データ1131資料を大規模に解析してまとめあげたデータベースです。大学院生が作ったページです。
植物の遺伝子の発現量を調べるためのデータベースです。RNA-Seqという方法で調べたデータを扱っています。大学院生が作ったページです。

★ ツール開発

  • 生命科学で使う便利なツールを作っています。
  • 尾形ラボでは、2つのツールを公開しています。
ConfeitoGUI 多変量解析のひとつで、生命科学のビッグデータをきれいにグループ分けします。
MagicSuite 次世代シーケンサーのデータを手軽に直観的に解析できます。Windowsでも使えます。

★ 共同研究

  • 尾形ラボでは、ウェットの研究者とともに共同研究しています。主に腸内フローラなどのマイクロバイオームの解析です。

♦ イヌの腸内フローラの解析

  • 病気の犬の腸内環境を調べて、病気の原因となる菌を探しています。

♦ ヒトの口腔内フローラの解析

  • 人の口の中にいる菌を調べて、口臭や健康との関係を調べています。

★ 今後取り組んでみたい研究

♦ 樹木のデータベース

  • 樹木の外観・組織構造・遺伝子の特徴を総合的にまとめます。樹木の遺伝子は他の植物と異なり、科を超えて似ているものがあります。どのような遺伝子が科を超えて存在し、外観や組織構造に影響を与えているのかを調べたいと思っています。
  • 樹木は育ってきた数千年の情報を年輪の中に保存しています。年輪の情報は切り倒した後でも保存されます。年輪のビッグデータの解析にも取り組みたいと考えています。
  • クラシック音楽には欠かせないヴァイオリンなどの楽器は、今でも木で作られています。名器と呼ばれるような楽器がどのような木の構造をしているのか、名器の秘密に迫ってみたいと思っています。
♦ サラブレッドのデータベース

  • サラブレッドは400年にもわたって系統についての情報が記録されている珍しい動物です。その系統情報をゲノム規模での遺伝子解析につなげたいと考えています。サラブレッドが速く走ることができる秘密の解明に繋がるかもしれないと思っています。
  • また、過去の名馬のゲノム情報の復元にも挑戦してみたいと考えています。
  • 糞便や直腸のマイクロバイオームを調べることで、病気や健康状態をいち早く知ることができるのではと期待しています。馬糞の状態で馬の精神状態が把握できるのではと考えています。
  • 馬糞は、肥料としても重要です。肥料の微生物的特徴について明らかにしていきたいと考えています。
  • 最近発達してきた機械学習やAIを活用して、大規模なデータを集められる競馬の情報にも取り組んでみたいと考えています。
  • この研究は、現在、外部予算を獲得して実施しています。
♦ クラシック音楽のデータベース

  • クラシック音楽に限りませんが、音楽は楽譜に基づいて演奏されます。
  • あるとき、楽譜を眺めていて、ゲノムの塩基配列に似ているように思えてきました。
  • バイオサイエンスではありませんが、クラシック音楽の楽譜のインフォマティクスに挑戦してみたいと考えています。
  • まだ内容を検討している段階ですが、クラシック音楽の楽器の演奏(ピアノやヴァイオリンなど)をできる人は、ぜひ挑戦してみましょう。
  • ヴァイオリン教室なら、こちらへどうぞ。
♦ 他にも……
他にもさまざまなビッグデータに挑戦してみたいと思います。こんな情報を調べてみたい、というものがあれば、一緒に研究しましょう。
The KAGIANA Project (since 2006)
Kazusa: 2006-2009
Yokohama: 2010-2011
Osaka: 2012-2019