当サイトについて

当サイトについて

概要

主に生物学の話か、情報(IT)、バイオインフォマティクス (Computational Biology) 関連の話を好きに書いていきます。

記事の内容についてはできるだけ正確な内容を心がけていますが、時間が経つに連れて古くなったりするものもありますし、そもそも勘違いをしている場合もあります。その場合、ご指摘してくださると大変助かります。

確実な情報を得るために記事に附した参考文献や，他のサイトやドキュメントを見ることを強くおすすめします。

当サイトのコンテンツについてはCC BY 4.0に基づき引用してください。ただし、コンテンツ自体が他のコンテンツの引用を含む場合、元文献のCCを参照し、引用してください。

このブログの記事および発言は運営者個人に帰するものであり、所属組織の戦略、方針、内容とは一切関係がありません。

ヒストリ

2015年頃　個人ブログを開始

2018年11月　生物学・バイオインフォに関する記事を中心にWordpressへ分離・移行

2019年4月〜2023年12月　Google アドセンスによるサーバー代のまかない

2023年11月　スパムが多かったため閉鎖していたコメント欄を復活

2024年4月〜　基本的に新規記事から広告を廃止

2024年4月6日　ライセンスをCC-BY-NCからCC-BY 4.0へ変更

4件のコメント

tetu
2021年6月30日 @ 15:27

「NovaseqやNextSeqのシーケンスデータにポリG配列(poly-G)が含まれる」の記事を拝見しました。少し気になったのですが、どうしてFASTQCとfastpを併用されているのでしょうか？
fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか？？
- Kim
  2021年7月2日 @ 13:50
  
  tetuさん
  
  > どうしてFASTQCとfastpを併用されているのでしょうか？
  > fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか？？
  
  おっしゃるとおり、fastpはクオリティチェックもできます。
  ただFastQCではシーケンスのPhred Scoreの分布や、重複して大量に含まれている配列などを検出して警告してくれます
  特に重複した配列は今回のように何かしらのエラーを指し示すことがあるので念の為チェックするようにしています
  その他はfastpと同等の機能なので、特にそうした項目を見るのでなければfastpで十分だと思われます
  (結果もfastpのほうが見やすいですし)
  - tetu
    2021年7月8日 @ 10:53
    
    Kimさん
    
    なるほど、そうなんですね！ちょっと使ってみようと思います。
    ブログいつもためになってます、これからも無理しない程度に更新していただけると嬉しいです！！
    - Kim
      2021年7月8日 @ 12:25
      
      tetuさん
      
      ありがとうございます！
      なかなか忙しくて更新ペースが低いですが、今後も更新を続けていきたいです