令和6年12月21日作成
原題:「Strukturelle Analyse von Sequenzdaten in der Virologie」
英訳:「Structural analysis of sequence data in virology」
邦訳:「ウイルス学における配列データの構造解析」
著者:ハンブルグ出身の数学者(匿名希望)
掲載号:No. 1/2022
SARS-Cov-2を例とした初歩的アプローチ
概要
de novoメタトランスクリプトーム配列決定または全ゲノム配列決定は、ウイルス学で認められている方法であり、病原ウイルスとされる粒子を検出するために用いられる。ウイルス粒子(ビリオン)を検出したり、単離したり、生化学的に特性決定したりすることはない。SARS-CoV-2の場合、患者のサンプル(気管支肺胞洗浄液(BALF)や咽頭鼻腔スワブなど)からRNA全体を抽出し、塩基配列を決定することが多い。 特に、ウイルスゲノム配列の計算に使われるRNA断片がウイルス由来であることを証明するものはない。
そこで、提案されたSARS-CoV-2(GenBank: N908947.3)のオリジナルの遺伝子配列について、「A new coronavirus associated with human respiratory disease in China」[1]という論文と、それに関連する2020年1月27日付けのバイオプロジェクトID PRJNA603194の公開配列データを調べた。Megahit (v.1.2.9)を用いてde novoアセンブルを繰り返した結果、公開された結果を再現できなかった。文献[1]の報告とは異なり、ヒト由来の(リボソーム)リボ核酸が検出された可能性がある。 さらに解析を進めた結果、PCRによる確認中にリードが非特異的に増幅された可能性があること、およびSARS-CoV-2(MN908947.3)とは関連しないゲノム末端が決定されたことが明らかになった。最後に、SARS-CoV、ヒト免疫不全ウイルス、デルタ肝炎、麻疹、ジカ熱、エボラ出血熱、マールブルグなど、他のゲノム配列との参照ベースのアセンブリーを行い、利用可能な配列データとそれぞれの配列との構造的類似性を調べた。我々は、次のような第一段階の示唆を得た。すなわち、この研究で解析したウイルスゲノム配列のいくつかは、疑う余地のないヒト由来のRNAから得られる可能性があるということである。