山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

「NGSデータが返ってきたけど何もできない」を解決したくて起業して16年。バイオ×ITの交差点で、研究者が本当に使える知識を発信。ゲノム医療 / 創薬DX / バイオ人材育成東京科学大学客員教授博士採用、絶賛強化中。

東京都

Joined March 2010

112 Following

1.7K Followers

2.1K Posts

Pinned Tweet

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 1 month ago

【自己紹介】はじめまして、山口昌雄です。理化学研究所でゲノム研究をしていた頃、「データはあるのに、解析できる人がいない」という現実を何度も見てきました。それが2009年の起業の原点です。博士課程進学と留学、創薬ベンチャーを経て、バイオインフォマティクス一本に絞って17年。 NGSデータ解析・ゲノム医療・AI創薬の現場を歩き続けています。このアカウントでは・バイオ×ITの最新トレンド・研究者のキャリアと市場価値・スタートアップ経営の現実を中心に発信していきます。バイオ系の研究者、院生、データサイエンスに興味のある方とつながれると嬉しいです。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 1 hour ago

生成AIで、誰でもコードが書ける時代になった。バイオインフォの現場も例外じゃない。解析スクリプトの下書きは、確かに速くなった。では、人間の仕事は減るのか。私はむしろ、別の能力の価値が上がると見ている。 AIは「どう書くか」を肩代わりしてくれる。でも「何を問うか」「出てきた答えが正しいか」は肩代わりできない。生物学的におかしい結果を、AIは堂々と出してくる。それを「これは変だ」と止められるのは、現場を知っている人間だけだ。コードを書く力が民主化されるほど、問いを立てる力と、結果を見抜く目の差が、そのまま成果の差になる。道具が賢くなるのは歓迎だ。ただ、賢い道具を使いこなすには、使い手のほうも問いを磨き続けないといけない。 AIに仕事を奪われるのではなく、AIを疑える人が残る。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 14 hours ago

今週は社内の勉強会で、入社一年目のメンバーが解析の失敗談を発表してくれた。うまくいった話より、つまずいた話のほうが、聞いている全員の身になる。私が口を出すより、本人が「ここで丸一日溶かしました」と語るほうが、誰の記憶にも残る。失敗を笑い話にできるチームは、強い。来週も、誰かのつまずきを共有する場をつくろうと思う。

378

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 16 hours ago

シングルセル解析のブログ記事で1番人気だったのがこちら。

バイオインフォマティクス実践ラボ

@BioinfoLab

about 21 hours ago

【シングルセル解析部門人気記事第1位】 scRNA-seq解析において、複数データセットの統合は重要なステップです。Seuratの「merge」と「IntegrateData」の違いと、適切な使い分けについて解説します。 https://t.co/0yhrhXedzt シングルセル解析の定番ツールであるSeuratを用いた、複数データセットの統合手順を紹介します。単純な結合であるmergeと、バッチ効果を補正するIntegrateDataの機能的な違いを理解し、解析の精度向上にご活用ください。 ※2023年1月〜2025年12月の弊社サイトPV数に基づくランキング（自社調べ） #シングルセル解析 #Seurat #データ解析 #バイオインフォマティクス #技術ブログ

BioinfoLab's tweet photo. 【シングルセル解析部門人気記事第1位】
scRNA-seq解析において、複数データセットの統合は重要なステップです。Seuratの「merge」と「IntegrateData」の違いと、適切な使い分けについて解説します。

https://t.co/0yhrhXedzt

シングルセル解析の定番ツールであるSeuratを用いた、複数データセットの統合手順を紹介します。単純な結合であるmergeと、バッチ効果を補正するIntegrateDataの機能的な違いを理解し、解析の精度向上にご活用ください。
※2023年1月〜2025年12月の弊社サイトPV数に基づくランキング（自社調べ）
#シングルセル解析 #Seurat #データ解析 #バイオインフォマティクス #技術ブログ

Who to follow

JSBi

@npoJSBi

日本バイオインフォマティクス学会（JSBi）は、生命科学と情報科学が融合した学問領域であるバイオインフォマティクスの研究・教育の推進を目的とする学会です。認定試験第1回7/11-8/9第2回11/7-12/6 IIBMP2026　8/26-28 相模大野　https://t.co/6Pj1MToH7v

Yoshihiro Yamanishi

@YoshihiroYamani

Professor at Nagoya University. President of JSBi. Board of Directors of ISCB. Bioinformatics, Chemoinformatics, Drug Discovery, Machine Learning, AI Medicine.

小野浩雅 ONO Hiromasa

@h_ono

プラチナバイオ株式会社 PtBio Inc. 事業推進部ディレクター / 広島大学ゲノム編集イノベーションセンターバイオDX産学共創拠点プロジェクトマネージャー / #BioSkillDX https://t.co/YZ6jtKJ2Oz

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 17 hours ago

単一細胞から空間アトラスへ——トランスクリプトーム解析がAIで一気に塗り替わりつつある、というレビューが出た。どの細胞がどこにいて、何を発現しているか。点の情報だった発現データが、組織の地図として読めるようになってきた。データが立体になるほど、見たいものを定義する力が問われる。可視化の派手さより、問いの解像度が成果を分ける。 https://t.co/rwYbLB4qd8

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 20 hours ago

発現変動遺伝子のリストを「パスウェイ解析」にかけて満足する人は多い。でも落とし穴が並んでいる。 ① 背景遺伝子の設定ミス：全ゲノムを背景にすると、検出した時点で偏っているものが有意に出る。使った発現遺伝子を背景にする。 ② 多重検定の放置：何百ものパスウェイを一気に検定する。補正なしの「有意」は信じない。 ③ 遺伝子数の偏り：大きなパスウェイほど引っかかりやすい。 ④ 解釈の飛躍：「この経路が有意」と「この経路が原因」は違う。よくある間違いは、出てきた経路名を見て物語を作ってしまうこと。エンリッチメントは仮説を生む道具で、答えを出す道具ではない。きれいな経路名ほど、一度疑ったほうがいい。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

about 22 hours ago

バイオインフォマティクス解析の基礎を解説する記事の４つ目は、次世代シーケンサーで変異解析をする手順を中心に解説しました。入門的な内容なので、これからNGS解析やオミクス解析に携わる方の参考になれば幸いです。 https://t.co/AFYXuIR5yi

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

1 day ago

データは多ければ多いほどいい、と思われている。現場の実感は逆だ。質の悪いデータが大量にあると、間違った結論に「統計的な自信」までついてしまう。少なくても、設計のきれいなデータのほうが正しい答えにたどり着く。量は、質をごまかせない。

686

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

1 day ago

採用の書類で、経歴に空白や回り道があると不利だと思っている人が多い。私はむしろ逆に見る。バイオから一度離れてITをやった、留学で時間がかかった——そういう寄り道をした人ほど、複数の言葉を話せる。専門が一直線の人は深いが、領域をまたぐ仕事で詰まることがある。回り道は、履歴書の傷ではなく、引き出しの数だ。まっすぐだけが強さじゃない。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

1 day ago

1,019人ぶんのヒトゲノムを長いリードで読み、これまで見えなかった構造変異の地図が描かれた——Natureの研究だ。短いリードでは飛ばしてしまう大きな欠失や挿入が、ようやく集団規模で捉えられる。参照ゲノム一本では取りこぼしていた多様性が見えてくる。「標準のゲノム」から「多様性のゲノム」へ。臨床で誰のゲノムと比べるか、という前提が変わっていく。 https://t.co/NMxFwxqgLc

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

2 days ago

解析が複雑になるほど、「手順を手で回す」のが限界になる。パイプライン管理を入れる判断軸を整理する。 ① ステップが5つを超えたら導入を検討。手作業のコピペはミスの温床。 ② NextflowかSnakemakeが定番。チームにPython文化があるならSnakemakeが入りやすい。 ③ 途中で失敗しても、成功したステップからやり直せるのが最大の利点。 ④ 設定ファイルにパラメータを集約すると、半年後の自分が救われる。よくある間違いは、使い捨ての解析にまで重装備を入れること。1回きりならシェルスクリプトで十分。道具は、繰り返す作業にこそ効く。導入の目的は「楽をする」ではなく「同じ結果を再現する」ことだ。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

2 days ago

会社を17年続けて、一番難しかったのは「始める」ことより「やめる」ことだった。数年前、ある新しい解析サービスに力を入れた。技術的には面白く、社内の熱量も高かった。でも、1年たっても顧客の反応が鈍い。ここで経営者を試すのは、「もう少し続ければ」という希望だ。投じた時間と人が惜しくて、判断が遅れる。サンクコストという言葉は知っていても、自分の事業になると効かない。最終的にそのサービスを畳んだとき、抜けた人手を主力に戻したら、半年で売上が伸びた。やめたから、次に進めた。撤退は失敗の証じゃない。続けるべきものに資源を返す、攻めの判断だ。何を始めるかと同じくらい、何をやめるかで会社の形は決まる。

480

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

3 days ago

次世代シーケンサー（NGS）に関するNote記事をアップしました。今回はナノポアです。 https://t.co/UZzUZVxYFx

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

3 days ago

アカデミアから企業に移る研究者を、何人も見てきた。うまく適応する人と、苦しむ人の差は、能力ではない。「時間の流れ」への向き合い方だ。研究の世界では、ひとつの問いを何年もかけて掘る。深さが価値になる。一方、企業では、同じ問いに半年も使えないことがある。事業には締め切りがあり、完璧でない答えでも出さなければ前に進まない。ここで多くの人が「手を抜いている」と感じて葛藤する。でも、それは手抜きではない。限られた時間で最善を出すという、別の技術なんだ。私が伝えたいのは、深さを捨てる必要はないということ。深く考える力はそのままに、「今わかっている範囲で決める」訓練を足せばいい。研究の厳密さと、事業のスピード。両方を行き来できる人が、結局どちらの世界でも信頼される。移るときに失うものより、足せるもののほうが多い。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

3 days ago

「万能なゲノム基盤モデル」を専門特化のモデルと比べたら、必ずしも勝てなかった——Nature Communicationsのベンチマーク研究だ。病原性変異の判定では健闘したが、遺伝子発現の予測などでは特化型に及ばない場面があった。大きいモデルが常に強いわけではない、という冷静な結果だ。流行に乗る前に、自分の課題に合う道具を選ぶ。ベンチマークを読む力は、これからもっと要る。 https://t.co/w3gX37F65Y

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

3 days ago

ゲノム解析がクラウドに移って、計算資源の心配は減った。でも代わりに、新しい落とし穴ができた。データの保管料と転送料だ。解析そのものより、テラバイト級のデータを置きっぱなしにする費用がボディブローのように効く。使い終わった中間ファイルを消すだけで、請求が半分になることもある。計算が速くなった分、誰もデータを捨てなくなった。安くなったはずのゲノム解析が、別のところでお金を食う。コスト感覚は、いまも現場の競争力だ。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

3 days ago

RNA-seqの発現量、どの単位で比べるかで結論が変わる。基本を整理する。 ① CPM：総リード数で割っただけ。サンプル間の比較向き。遺伝子の長さは無視。 ② FPKM/RPKM：遺伝子の長さでも補正。同一サンプル内で遺伝子同士を比べる時に。 ③ TPM：FPKMの弱点を直した版。合計が揃うのでサンプル間比較に向く。今はこれが主流。 ④ 生のカウント：DESeq2などに渡すのはこっち。正規化済みを入れてはいけない。よくある間違いは、TPMをそのまま統計検定にかけること。可視化と検定では使う値が違う。単位を取り違えると、出てくる差はすべて幻になる。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

4 days ago

バイオ系の学生から「何を準備すれば転職で有利ですか」と聞かれる。資格でも、有名な研究室名でもない。一番効くのは、自分で動かせるコードを公開しておくことだ。小さくていい。あるデータをこう処理して、こう可視化した——その過程が残っていると、面接官は能力を10分で把握できる。論文は読めばわかるが、手を動かせるかは作品でしか伝わらない。実績がないなら、作ればいい。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

4 days ago

ゲノムを学習した言語モデルが、機能する遺伝子を「自動補完」のように設計した——Natureに載った研究だ。文章を予測するAIと同じ仕組みで、塩基配列の続きを生成する。設計が机上ではなく、実際に機能するレベルに来ているのが驚きだ。配列を「書ける」時代に、何を書くべきかを決めるのは人間の問いだ。生成の精度より、目的の設計が次の勝負どころになる。 https://t.co/US9sb8I8Nn

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

4 days ago

「何リード読めばいいですか」という質問は、解析の入口で必ず出る。深さの目安を整理しておく。 ① 変異検出（全ゲノム）：30xが定番。これ未満だとヘテロ接合を見落とす。 ② エクソーム：100x前後。狙いを絞る分、深く読む。 ③ RNA-seq（発現量）：深さより、まず生物学的反復の数。 ④ 単一細胞：細胞数とのトレードオフ。深さを欲張ると細胞が減る。よくある間違いは、「とにかく深く読めば安心」という思い込み。深さより、反復数が足りずに統計が成り立たないケースのほうが圧倒的に多い。お金をかけるべきは、深さではなくサンプル数のことが多い。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

4 days ago

「同じデータと同じコードなのに、結果が再現できない」——これは研究の世界で静かに広がっている問題だ。原因の多くは、目に見えないところにある。使ったツールのバージョンが違う。乱数の種が固定されていない。OSやライブラリの依存関係が少しずれている。論文には書かれないこれらの差が、数字を変える。私が現場で徹底しているのは、解析環境ごと記録に残すことだ。コンテナに固めて、誰が何年後に動かしても同じ結果が出るようにする。面倒だし、論文の評価に直接は効かない。でも、再現できない結果は、どれだけ美しくても積み上がらない。サイエンスは「他人が確かめられること」で成り立っている。再現性は、派手さのない、しかし一番大事な作法だ。

山口昌雄｜バイオインフォ研究者｜アメリエフ代表

@chemi384

Who to follow

Last Seen Users on Sotwe

Trends for you

Most Popular Users