Protein blast における ‘Positives’ はどんな意味か? Kim 2023年12月30日 2023年12月30日バイオインフォマティクス バイオインフォマティクス, NCBI, アライメント, BLAST 0 tblastn、blastp をして結果を眺めて整理していたとき、あまり気にしていなかったが “Positives” というスコアがあることに気づいた。 そのとなりにある “Identities” はアライメントされたアミノ酸残基の完全一致率、数を示し… Continue reading
MyGene.info のAPIを叩いてみる Kim 2023年9月14日 2024年10月24日ゲノム解析, Web, IT, Python, バイオインフォマティクス, Python Web, ゲノミクス, Ensembl, Python, バイオインフォマティクス, NCBI 0 タンパク質のRefSeqID(NPやXPから始まるID)を大量に持っていて、それをPython上でなんとかGene symbolに変換できないかを模索していた。 そんなとき、MyGene.info というサービスを見つけた。あまり日本語のドキュメントがないので軽く紹介しておく。 MyGene.i… Continue reading
NCBI のAPIで”API rate limit exceeded”と出る Kim 2022年10月25日 2023年11月27日バイオインフォマティクス NCBI, Web 0 NCBIのAPIでFASTAなどを取得するツールを作っているのだが、非同期処理を導入して大量に並列取得をしようとしたところ”API rate limit exceeded”とエラーが出ていることが判明した。 ググると以下のページのように、アクセス制限が存在することが明らかにな… Continue reading
NCBI Gene の検索結果から一括で配列取得する方法 – Anaconda環境の導入・NCBI Geneの使い方から取得まで Kim 2020年4月23日 2023年11月27日バイオインフォマティクス, Python Python, バイオインフォマティクス, NCBI 0 現在在宅で研究をせざるを得ない状況下からか、このサイトのアクセス数が伸びている。 これを期にDRY解析を始めようと思っている人は、配列を自分で持っておらず、公開データベースを用いることが多くなると思うが、いちいち手動でFASTAファイルをダウンロードする方法はいささか効率が悪い。そこで今回は著者が開… Continue reading
NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて Kim 2019年12月24日 2023年11月27日バイオインフォマティクス, Python Python, バイオインフォマティクス, NCBI 0 NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの… Continue reading