バイオインフォマティクス – Kim Biology & Informatics

遺伝研スパコン(Linux)でリファレンスゲノムを集める

Kim 2026年1月28日 2026年1月28日ゲノム解析, IT, バイオインフォマティクス, Linux 0

　遺伝研スパコンやLinux, Ubuntuなどの環境でNCBIのリファレンスゲノムを集める方法を基本から抑える。学部生に指導したときの資料を下敷きにしている。　ゲノムの選定方法などについては以前の記事を参照してほしい。 Linux基本コマンド　簡単におさらいしておく。カレントディレクトリの確…

【Qiskit】マルチオミクス解析を量子機械学習でやる①[環境構築・基礎]

Kim 2025年6月17日 2025年11月23日Qiskit, 量子コンピュータ, バイオインフォマティクス 0

今回からの記事は IBM の Qiskit で量子機械学習をマルチオミクスデータに向けてやろうというものである。昨年のカンファレンスの資料と Notebook が公開されていてダウンロードしていたのだが、論文やらなんやらで色々忙しいのを言い訳に塩漬けにしていたのをなんとか掘り起こそうという備忘録だ。…

Cell Hashing による複数サンプルデータ読み込み

Kim 2025年3月28日 2025年3月28日RNA-seq, バイオインフォマティクス, Python 0

今回はシングルセルシーケンスにおける Multiplex Samples の取り扱いについて簡単に書き残しておく。昨今流行しているシングルセルシーケンスであるが、複数のサンプルにそれぞれ “Hashtag” (ハッシュタグ) をつけることで、混合してシングルセルシーケンスし…

NCBIからリファレンスゲノムを取得する方法〜クォリティなどのチェックも〜

Kim 2024年12月14日 2024年12月14日ゲノム解析, バイオインフォマティクス 0

導入ヒトやマウスといったモデル生物以外のゲノムが染色体レベルで組み上がる時代に突入している。ゲノム「解読」黎明期ではゲノムを決定することで様々な生命現象が明らかになると思われていたが、実際は一次元の塩基配列だけでわかることには限界があるということがその後段々と浸透していった。そのため現在では「ゲノ…

VGP(脊椎動物ゲノムプロジェクト)のポリシー改定について

Kim 2024年11月2日 2024年11月2日ゲノム解析, バイオインフォマティクス 0

背景近年の次世代、あるいはロングリードシーケンサなどの発展に伴い、生物のゲノム決定が容易になっている。NCBI Genomeなどを覗くと、実に様々なマイナーな生物までゲノムがChromosomeレベルで決定されているのを目にすることが多いだろう。高品質な脊椎動物のゲノムが多く登録されており、アノテ…

RepeatModelerでアノテーション出来ないTEを分類するcTENOR

Kim 2024年10月1日 2024年10月1日ゲノム解析, バイオインフォマティクス 0

ヒトやマウスなどのモデル生物ではRepbaseなどのリピート配列やTE(トランスポゾン)配列などのアノテーションが充実している。一方で、新規にゲノムを決定する・した生物ではそれがそもそもされていない場合が多い。 de novoでライブラリを作成し、アノテーションするパイプラインのゴールドスタンダード…

IBM ゲート型量子コンピュータを用いたmRNA二次構造の予測

Kim 2024年7月16日 2024年7月16日量子計算, 量子コンピュータ, Qiskit, バイオインフォマティクス 0

近年量子コンピュータが注目されているが、応用先については「創薬」「金融」といった抽象的なものはよく取り上げられるが実際どの程度の具体的な事例に適用できるかについてはあまり耳にしないと思う。今回はIBMとモデルナ(新型コロナウイルスのmRNAワクチンで有名になった会社)が実際に協働して量子コンピュー…

「ゲノム丸ごと」生成できるAI(基盤モデル) Evo

Kim 2024年5月28日 2024年11月18日ゲノム解析, 生物, バイオインフォマティクス 1

2024年11月16日追記: 本論文は Science に掲載されました。OAではなく筆者は読めないので、最新の内容を知りたい方は本文を参照してください。また、本記事はメジャーリビジョンの前のbioRxivのv3に基づいて執筆しています。最近公開されたv4では図が新しくなっているので、もしアクセス…

生命科学における量子計算アプローチ

Kim 2024年4月18日 2024年7月12日ゲノム解析, 量子コンピュータ, 量子計算, バイオインフォマティクス 0

今回は量子コンピュータが生命科学にどういう形でアプローチできるのか、最近(2022年)のレビューを通じて紹介したい。量子コンピュータに限らず、現在の動向を色々と抑えて書き留めたいと思う。最近の計算生命科学(バイオインフォ)の動向最近のバイオインフォマティクスの分野の発展は著しい。特にタンパク質の…

RNA velocity について

Kim 2024年4月12日 2024年4月12日RNA-seq, バイオインフォマティクス 0

今回は RNA velocity (直訳するとRNA速度だが、適切な語訳ではないため、RNA velocityとして記述する)について説明する。 RNA velocity の基礎知識 RNA velocity は2018年に La Manno らが発表・提唱したもので、(一般に)scRNA-seq …

カテゴリー: バイオインフォマティクス

遺伝研スパコン(Linux)でリファレンスゲノムを集める

【Qiskit】マルチオミクス解析を量子機械学習でやる①[環境構築・基礎]

Cell Hashing による複数サンプルデータ読み込み

NCBIからリファレンスゲノムを取得する方法〜クォリティなどのチェックも〜

VGP(脊椎動物ゲノムプロジェクト)のポリシー改定について

RepeatModelerでアノテーション出来ないTEを分類するcTENOR

IBM ゲート型量子コンピュータを用いたmRNA二次構造の予測

「ゲノム丸ごと」生成できるAI(基盤モデル) Evo

生命科学における量子計算アプローチ

RNA velocity について

Recent Posts

終活

遺伝研スパコン(Linux)でリファレンスゲノムを集める

【Qiskit】マルチオミクス解析を量子機械学習でやる①[環境構築・基礎]

Cell Hashing による複数サンプルデータ読み込み

肺の起源と進化について

カテゴリ

人気の記事

Recent Posts

カテゴリ