tblastn、blastp をして結果を眺めて整理していたとき、あまり気にしていなかったが “Positives” というスコアがあることに気づいた。
そのとなりにある “Identities” はアライメントされたアミノ酸残基の完全一致率、数を示しているのはわかるが、Positives はどういう意味なんだろうと調べるもあまり情報がない。

よくよくドキュメントを調べていくと、アライメントのスコアリング時に計算された値が正の値を示しているアミノ酸残基の数を示していることがわかった。
例えばデフォルトではBLOSUM62というスコアを使っている(以下の図)が、これが正の数を取るとき、BLAST結果のアライメントの中段には「+」と表示される。

Positives スコアはこの+の数、および完全一致の数を合わせた数に基づいて計算しているようだ。
参考文献
BLAST Scoring and Statistics Alignment scoring
https://www.nlm.nih.gov/ncbi/workshops/2023-08_BLAST_evol/blast_score.html