PoTHoSの紹介
はじめに
PoTHoSは主にRNA-Seqのデータを解析するためのウェブサイトです。 次世代型シーケンサーが出力するデータを加工し、研究者が知りたいと思うデータを簡単に取り出すことができるようにすることを目的に開発しています。
使い方
メニューの操作
ページの左にデータや解析方法(合わせてメニューとします)を階層的に表示しています。 フォルダのアイコンで示される項目はその左の+をクリックすると下のメニューが表示されます。 ファイルのアイコンのついているメニューには下の項目がありません。 フォルダのアイコン、ファイルのアイコンのいずれもクリックすることによってそのページを開きます。 まだ全ての項目についてページを用意できていないので、クリックしても反応がないところがあります。
現在開いているページはハイライトされます(できないところもあります)。 階層構造の開閉を制御できていないのでたびたび閉じてしまいますが、ご容赦ください。 ときにメニューに表示されないページに移動することもあります。
メニューの項目は右クリックで編集することができます。(ログインしていることを確認してください)。
プロジェクト
PoTHoSではデータのまとまりをプロジェクトとして管理しています。 基本的にプロジェクトにはfastqファイル、サンプル情報、マッピングの結果、アセンブルによってできるコンティグ、リファレンス、解析結果、などが含まれます。
プロジェクトはプロジェクトID(pr+6桁の数字)で識別されます。
ログイン
ログインすることで非公開の設定になっているプロジェクトを見ることができます。 また自身が所有するプロジェクト、メンバーとなっているプロジェクトがメニューに表示されます。
利用者登録はウェブ上からできないので、管理者にお問い合わせください。
データ解析の流れ
fastqファイルの登録
PoTHoSのデータ解析はfastqファイルの登録から始まります。 各プロジェクトには「ファイル」があり、ここにfastqファイルを登録します。 (注: 現在アップロードの機能はありません)
シークエンスの依頼をされたかたはここからfastqファイルをダウンロードし、バックアップをとっておくことをお勧めします。
サンプルの登録
通常一つのサンプル(ライブラリ)のデータは複数のfastqファイルに分かれています。 それらのファイルをまとめてサンプルとして登録します。
その後の解析でよくないサンプルであることがわかった場合や、解析にしようしない場合は削除してください。 または新しいサンプルセットを作成し、組み合わせを変えることができます。
グループの登録
反復実験で得られたサンプルはグループとしてまとめます。
アセンブル
得られたリードをアセンブルし、コンティグをつくります。 すでにcDNAの情報がある生物の場合アセンブルは必要ありません。
マッピング
bowtieをつかったcDNAへのマッピング、tophatを使ったゲノムへのマッピングができます。 tophatのほうはまだ遺伝子ごとの集計ができないので、発現量の解析には使えません。
マッピングのオプションが異なる複数のデータをプロジェクトに含むことができるようになりました。