当サイトについて

概要

主に生物学の話か、情報(IT)、バイオインフォマティクス (Computational Biology) 関連の話を好きに書いていきます。

記事の内容についてはできるだけ正確な内容を心がけていますが、時間が経つに連れて古くなったりするものもありますし、そもそも勘違いをしている場合もあります。その場合、ご指摘してくださると大変助かります。

確実な情報を得るために記事に附した参考文献や,他のサイトやドキュメントを見ることを強くおすすめします。

当サイトのコンテンツについてはCC BY 4.0に基づき引用してください。ただし、コンテンツ自体が他のコンテンツの引用を含む場合、元文献のCCを参照し、引用してください。

このブログの記事および発言は運営者個人に帰するものであり、所属組織の戦略、方針、内容とは一切関係がありません。

ヒストリ

2015年頃 個人ブログを開始

2018年11月 生物学・バイオインフォに関する記事を中心にWordpressへ分離・移行

2019年4月〜2023年12月 Google アドセンスによるサーバー代のまかない

2023年11月 スパムが多かったため閉鎖していたコメント欄を復活

2024年4月〜 基本的に新規記事から広告を廃止

2024年4月6日 ライセンスをCC-BY-NCからCC-BY 4.0へ変更

4件のコメント

  1. 「NovaseqやNextSeqのシーケンスデータにポリG配列(poly-G)が含まれる」の記事を拝見しました。少し気になったのですが、どうしてFASTQCとfastpを併用されているのでしょうか?
    fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか??

    • tetuさん

      > どうしてFASTQCとfastpを併用されているのでしょうか?
      > fastpでクオリティチェックもアダプタートリミングもできてしまうので、FASTQCを使ったことがないのですが、何かメリットがあるのでしょうか??

      おっしゃるとおり、fastpはクオリティチェックもできます。
      ただFastQCではシーケンスのPhred Scoreの分布や、重複して大量に含まれている配列などを検出して警告してくれます
      特に重複した配列は今回のように何かしらのエラーを指し示すことがあるので念の為チェックするようにしています
      その他はfastpと同等の機能なので、特にそうした項目を見るのでなければfastpで十分だと思われます
      (結果もfastpのほうが見やすいですし)

      • Kimさん

        なるほど、そうなんですね!ちょっと使ってみようと思います。
        ブログいつもためになってます、これからも無理しない程度に更新していただけると嬉しいです!!

        • tetuさん

          ありがとうございます!
          なかなか忙しくて更新ペースが低いですが、今後も更新を続けていきたいです

コメントは受け付けていません。