10-8 計算科学によるタンパク質のRNA相互作用部位の推定

−タンパク質立体構造にもとづくバイオインフォマティクス研究−

図10-13 RNAと相互作用するタンパク質の立体構造データベース

図10-13 RNAと相互作用するタンパク質の立体構造データベース

タンパク質がRNAとどのように相互作用するかを知るために、タンパク質とRNAとの結合構造データを収集しデータベースにしました。生物が持っているどのようなタンパク質がどのようなRNAとどのような構造で結合しているのかがわかります。右の絵は、あるタンパク質とRNAとの結合3次元構造です。青、赤、緑のボールの集合体がタンパク質を、手前にある棒細工がRNA分子を表現しています。赤と緑のボールがタンパク質のRNA結合面です。

図10-14 RNAとの相互作用面推定の結果例

図10-14 RNAとの相互作用面推定の結果例

データベースから得られた様々な統計量を用いて、タンパク質のRNAとの結合面を推定します。実際にRNAとの結合面がわかっているタンパク質を使って、結合部分はどこであるかを伏せておき、予測をします。タンパク質(ボールの集合体)のオレンジから赤い部分が結合面と予測されました。

生物は身近な紫外線や放射線などの強い光の攻撃に常にさらされています。放射線などに代表される光による攻撃は、生物が持つDNAに損傷を与えることがわかっています。DNAの損傷は光などの外部からの要因だけでなく、体内にある酸素も時にはDNAやRNAを傷をつけます。このように生物を構成する物質は、生活や生命活動を通して様々な局面で損傷を受けます。これらの損傷は老化の分子的原因とも考えられています。一方、長い進化の間に、生物は様々なDNA損傷を経験し、損傷を修復する装置を使って生き延びてきました。どのような装置で、どのようにして損傷が修復されているのかについては、現在盛んに研究されています。損傷を修復する装置は、おもにタンパク質で構成されていることがわかってきています。

21世紀の最初にヒトのゲノム塩基配列の読み取りが終了しました。このことは、ヒトを構成する物質の設計図が手に入ったことを意味します。しかしその設計図を読み解くことができていません。ヒトのゲノム塩基配列は30億程度の文字列で表現することができ、その文字列を「解読」する必要があるのです。解読の研究は、計算科学(コンピュータ)と生物学とが手を組まなければ、進めることができません。これがバイオインフォマティクスです。ここに紹介する研究は、ゲノム塩基配列の解読を進めることで、どのようなタンパク質がどのようにしてDNAやRNAの損傷を修復していくのかを解き明かしていこうとしている研究の一環です。

DNAやRNAの修復をするタンパク質は、まずはDNAやRNAと結合する必要があります。タンパク質のどの部分でRNAと相互作用するのかがわかれば、修復の仕組み研究の第一歩となります。RNAがタンパク質に結合しているときの構造は、多くの研究者の長年の研究により少しずつ明らかにされています。そこで、これらの情報を集めデータベースを作りました(図10-13)。多くの構造が集まると、それらを統計処理することで、タンパク質とRNAとの結合面にはどのような特徴が存在するかがわかってきます。RNAが結合するタンパク質の面はどれくらいの広さを持つのか、どのような性質の原子が存在するのかなどがわかってきます。その結果を用いて、今度はRNAとの結合の様子がわかっていないタンパク質に対して、RNAと結合しそうな面を見いだす予測を行うことができます。様々な統計処理の方法を開発し、その方法を用いることで、いままでよりも高い精度でRNAと結合するタンパク質面を見いだすことができるようになってきました(図10-14)。

タンパク質のどの部分でRNAと相互作用するのかを計算科学の手法で推定できるようになると、この方法を用いて、分子生物学実験をくみ上げることができるようになります。計算科学と分子生物学の協力により、生命を支える分子がどのように働いているのかを解き明かすことができるようになってきています。


●参考文献
Kim, T.P.O., Yura, K. et al., Newly Sequenced eRF1s from Ciliates: the Diversity of Stop Codon Usage and the Molecular Surfaces that are Important for Stop Codon Interactions, Gene, 346, 2005, p.277-286.