手こずったので備忘録。
ある遺伝子IDとカウントデータが存在し、別の条件で遺伝子IDだけを絞り込んだデータフレームが存在した。
その絞り込んだ遺伝子IDが含まれるカウントデータデータフレームのレコードが必要だった。
最初はdf[df$geneid == df_another$geneid]とかでやっていたが全然うまくいかない。ググったけどいいものがなかった。
結論
cond_id = df$gene_id %in% top50$gene_id df[cond_id,]
dfは元のカウントデータが存在する「レコードを抜き出したいデータフレーム」。top50は条件絞り込みを行ったデータフレームだ。
%in%
を使うことで「含まれているかを判定」している。