慶應義塾大学先端生命科学研究所慶應義塾大学先端生命科学研究所

研究紹介

HOME 研究紹介 研究ハイライト 論文ハイライト 一般化GC非対称性指数による複製関連の変異・選択圧の定量化

一般化GC非対称性指数による複製関連の変異・選択圧の定量化

ゲノムの配列からその複製メカニズムを推定できる画期的新手法

Arakawa, K., Suzuki, H., and Tomita, M. (2009) Quantitative analysis of replication-related mutation and selection pressures in bacterial chromosomes and plasmids using generalised GC skew index. BMC Genomics, 10, 640.

 地球上の全ての生物は,バクテリアから私たち人類を含む現存するあらゆる生き物,そして,恐竜のようにかつては地上を闊歩したものたちにいたるまで,全てがAとTとGとCの4文字で書かれたゲノムを持っている.多くの真核生物のDNAではこれらの文字はほぼ均等に20~30%程度ずつ使われているが,単細胞微生物であるバクテリアではGC含量と呼ばれるGとCの文字の総量は,実に10%から90%程度までさまざまである.また,DNAは決まった方向(5'末端から3'末端方向)にしか複製ができないため,複製を開始する場所を中心に,順方向に複製されるリーディング鎖と逆方向なラギング鎖に二分でき,これらの領域においても,塩基(文字)の使われ方には偏りが生じる.例えば漢字が多い文章が難解に思え,ひらがなが多い文章が詩的な,あるいは幼稚な印象をあたえるように,このようなDNAの塩基組成の偏りは,どのような遺伝子がゲノムに存在し,それらがどのように配置されるか,という基本的な枠組みを方向づける.

 一方で,このようなDNAの文字の偏りの程度を定量的に評価することは難しい課題だ.複製の開始・終結点が均等に存在していなければ局所的な偏りと全体的な偏りの影響は変わってくる.また,ゲノムの大きさはプラスミド(バクテリア細胞内に本来の設計図である染色体とは別に存在する,細胞間を移動可能な小さな環状DNA)など小さなものでは数千文字程度だが,バクテリアでは数百万文字,そして真核生物では数十億文字もの長さを持つなど,非常に大きな分散がある.ケータイ小説における文字のばらつきと,百科事典における文字のばらつきを同等に評価できるような,極めて広い応用性を持った数学的手法がなければ,大きな多様性を持つ幾千ものゲノム配列を比較して解析することはできない.

 そこで荒川講師らは,これまで彼らが開発した高速フーリエ変換をもちいたゲノム塩基組成の偏りとノイズを分離する方法 ,さらに,その手法を応用してGC skewというリーディング鎖とラギング鎖に使われる文字の方より度合いをバクテリアゲノムで定量化する方法 を拡張し,フーリエパワースペクトルの主要成分とゲノムの長さで正規化された二本鎖塩基組成ユークリッド距離の幾何学平均をもちいることで,この偏りをどのような長さのゲノムでも正確に定量化することに成功した.そして,この新規数学的手法を一般化GC非対称性指数(generalized GC Skew Index: gGCSI)と命名した.

 リーディング鎖とラギング鎖は,複製起点によって二分される.よって,これらの間の塩基組成の偏りは,DNAの複製機構がそれぞれの鎖に与える突然変異及び選択・淘汰の影響が異なることを示している.そこで,荒川講師らはこの新指標 gGCSIを用いて,さまざまなゲノムを比較解析した.その結果,ゲノムの文字の偏りを見るだけで,真性細菌と古細菌という2つの異なる微生物や,θ型複製をするプラスミドとローリングサークル型複製をするプラスミドなど,それぞれのゲノムに存在する複製機構の違いを正確に判別できることを示した.さらに,バクテリア細胞内に存在する染色体とプラスミドという2つのDNA分子においては,長期間同じ生物にプラスミドが存在することで塩基組成の偏りが似てくることが明らかとなった.同じ細胞中に存在するこれらのDNA分子は,細胞分裂によって同じタイミングで娘細胞に分配される.そこで,当然ながら同じようなタイミングで複製され,同じような複製による変異・選択を受けるのだ.これらの結果は,特にバクテリアにおいて,ゲノム中で使用できる文字の割合は複製のタイミングや複製機構のタイプによって規定されていることを示している.

 このような制約は,同時にどのような遺伝子がどのように配置されるか,ということに関しても大きな影響を与えていると考えられる.バクテリアのような単細胞生物では数十分ごとに一度複製と分裂を繰り返しており,早く増殖するためには数百万文字にもなるゲノム情報の複製を効率良く行う必要がある.だが,その増殖効率を支えるためにわざわざ設計図であるゲノムの文字の使い方にいたるまで柔軟に対応させている様子には,「生命のしたたかさ」を感じずにはいられない,と,荒川講師は語る.「生命はうまくできすぎている」とは冨田所長の言葉であるが,生きるために獲得されたさまざまな戦略を発見し,その絶妙さに驚かされることは,生物学の醍醐味の一つなのだろう.




:宿主(Host)とプラスミド(Plasmid)の塩基組成の偏りの度合いをgGCSIで求めると,強い相関が見られる.同じ細胞内に存在するDNA分子は,同じタイミングで細胞分裂が起きるので,似た複製関連の変異・選択圧を受ける.

TOPへ