概要
当サイトはKimが運営しております。
主に生物学の話か、情報(IT)、バイオインフォマティクス(Computational Biology)関連の話を好きに書いていきます。
記事の内容についてはできるだけ正確な内容を心がけていますが、時間が経つに連れて古くなったりするものもありますし、そもそも勘違いをしている場合もあります。その場合、ご指摘してくださると大変助かります。
確実な情報を得るために記事に附した参考文献や,他のサイトやドキュメントを見ることを強くおすすめします。
もし何かコメント等ありましたらここのページへのコメントでお願いします。
あまりにも海外からのスパムが多いのでコメント機能を無効化しました。
→ 2022年6月29日 あんまりにもここのページへのスパムコメントが多いので閉鎖しました。
→ 2023年11月27日 需要があるようなので、再開します。
GitHub(プライベートリポジトリ多めなのでそこまで公開していません)
https://github.com/kim2039/
当サイトのコンテンツについてはCC BY-NC 4.0に基づき引用してください。ただし、コンテンツ自体が他のコンテンツの引用を含む場合、元文献のCCを参照し、引用してください。
目的
- 自分用の備忘録
- 生命科学(特に進化生物学)の一般社会に向けた発信
自己紹介
進化生物学をやっている大学院 博士後期課程3年生。
幼い頃より脊椎動物の陸上進出について興味があり、現在も研究を続けています。同じくらいITや効率化ツールの開発、電子工作などに興味があり、趣味として開発をしています。
学部時代はショウジョウバエの精子の進化について発生学的観点から研究していました。同時に個体ベースモデルによるシミュレータを開発し、シミュレーションベースからの観点から精子の長さの進化を解析していました。
開発したシミュレータは公開しています(https://github.com/kim2039/SpermSimulator)。
「NovaseqやNextSeqのシーケンスデータにポリG配列(poly-G)が含まれる」の記事を拝見しました。少し気になったのですが、どうしてFASTQCとfastpを併用されているのでしょうか?
fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか??
tetuさん
> どうしてFASTQCとfastpを併用されているのでしょうか?
> fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか??
おっしゃるとおり、fastpはクオリティチェックもできます。
ただFastQCではシーケンスのPhred Scoreの分布や、重複して大量に含まれている配列などを検出して警告してくれます
特に重複した配列は今回のように何かしらのエラーを指し示すことがあるので念の為チェックするようにしています
その他はfastpと同等の機能なので、特にそうした項目を見るのでなければfastpで十分だと思われます
(結果もfastpのほうが見やすいですし)
Kimさん
なるほど、そうなんですね!ちょっと使ってみようと思います。
ブログいつもためになってます、これからも無理しない程度に更新していただけると嬉しいです!!
tetuさん
ありがとうございます!
なかなか忙しくて更新ペースが低いですが、今後も更新を続けていきたいです