CATEGORY

解析

  • 2025年12月14日
  • 2026年1月3日

TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関係を解析する(TCGA, v.43, 2025)

2026/01/03(土);初稿 はじめに 以前、TCGAのデータを使って、がんや腫瘍における遺伝子発現量(RNA-seqのカウント値)と患者の生存率の関係をRで解析したが、そのときは対応する正常組織(おそらくがんや腫瘍周辺の正常部位)におけるRNA-seqのカウン値をダウンロードしなかったため、それらをバイオリンプロットを用いた疾患毎の遺伝子発現量もしくは遺伝子セットのエンリッチメントスコアの比 […]

  • 2025年12月14日
  • 2026年1月3日

TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関係を解析する(TCGA, v.41, 2024)

2025/12/14(日);初稿2025/12/29(月);訂正;カプランマイヤー法による生存率の解析;教科書(生存期間解析、ISBN978-4-254-12861-1)に従って、打ち切りの設定を確認し、生存曲線(カプランマイヤー推定値)の横軸を1825日(5年)に限定した。2026/01/03(土);訂正;元の記事のタイトル「TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関 […]

  • 2025年10月4日
  • 2025年11月8日

大きなデータセットのssGSEA2やforeachによるマルチスレッディングのときに突然RStudioが落ちる場合の対処方法

2025/10/04(土);初稿2025/11/08(土);追記;並列化が元から組み込まれているライブラリに対してforeachを使うのはそもそも良くない。 はじめに 以前TCGAやCPTACのデータをダウンロードしたが、最近はこれまで解析を行ってきた解析手順や手法をブログに記録しておくためそのデータを使って色々と解析を行っている。今後のためにと思って、多少無茶な解析でも行っているわけだが、そのと […]

  • 2025年5月8日
  • 2025年12月14日

用量反応関係(dose-response relationship)の測定結果をRのパッケージminpack.lmを使ってヒルの式にフィッティングしEC50を求める

日付;2025/05/8(木) はじめに ある薬剤にして何らかの生物現象、例えば、標的分子の発現量の減少、増殖能の抑制、アポトーシスの発生率等に対する薬効を数値化し、横軸(X軸)に用量(ここではDose)、縦軸(Y軸)に反応性(ここではResponse)をとってグラフ化すると、いわゆる「シグモイドカーブ」という曲線に従うことが多い。特に、あるタンパク質に対するリガンドの結合と、結果して起こるタンパ […]

  • 2025年3月16日
  • 2025年9月9日

Uniprotでタンパク質のMSA(Multiple Sequence Alignment)を行う

日付;2025/03/16(日) Uniprotを使った簡単なMSA(Multiple Sequence Alighment) 仕事で現在行っているプロジェクトが一段落しそうな雰囲気が出来てきた。この仕事をやりきった上で今年の7月に夏休みをとろうって感じになっている。そして、そのプロジェクトが一段落する時点で、タンパク質-タンパク質相互作用(Protein-Protein Interaction; […]

  • 2025年2月12日
  • 2025年12月20日

edgeRによる遺伝子発現解析・GSEAとclusterProfierによるパスウェイ解析

日付;2025/02/11(火) はじめに 先日、RNA-seqの解析でのFASTQのQC、アダプター除去(アダプタートリミング)、ゲノムへのマッピングの方法を記した。ここでは、それに引き続く解析であるedgeRによる遺伝子発現解析の方法、GSEAを使ったGSEA(Gene Set Enrichment Analysis)、clusterProfilerを使ったOverrepresentation […]

  • 2025年1月11日
  • 2025年3月25日

RNA-seqの解析におけるFASTQのQC・アダプター配列の除去・マッピング・リードカウントの方法

日付;2025/01/11(土)、2025/01/30(木)タイトル修正 はじめに 小さな研究室やアカデミックではRNA-seqの解析のためにN=5で2グループ取ることができれば上等で、経費を抑えるためにN=3や、最悪ではあるがN=2や1で解析を計画してしまうことも少なくないように思う。しかし、今回はそういうことはなく、N=5で合計40サンプルで行うことができた。しかし、こういった場合はやはり一連 […]

  • 2024年12月8日
  • 2025年11月8日

cellranger countがメモリ不足で止まる場合の対処方法

2024/12/7(土);初稿2024/12/10(火);SWAPパーティションの導入によりSWAPが動くようになった。2024/12/12(木);結局キャシュの定期クリアを設定する。2024/12/22(日);ちゃんとSWAPが利用されていた。 2025/09/28(日); crontabのところを訂正。 はじめに 最近、新しいPCでcellranger 9.0.0を使い出した。cellrang […]

  • 2024年10月27日
  • 2025年3月25日

pdc-clientを使ってCPTACの公開データをダウンロードする

日付;2024/10/27(日) はじめに 最近では、ナノポアシークエンサーでアミノ酸配列まで読めるようになってきた。これはつまり、プロテオームもハイスループットで読める時代がもうそこまで来てるってことである。現時点ではマルチプレックスのプロテオームはRNAシークエンスの価格の10倍くらいするので、なかなか手を出せる物でもない。しかし、こうやってハイスループットのタンパク質発現解析方法が開発されれ […]

  • 2024年10月27日
  • 2025年3月25日

gdc-clientを使ってTCGAの公開データをダウンロードする

日付;2024/10/26(土) はじめに TCGA(The Cancer Genome Atlas Program)は公的データベースであり、誰でも利用可能である。トランスレーショナルスタディーや、それに限らず基礎研究に対してもこんなに有用なものはない。オープンアクセスのデータだけでなく、限られたユーザーがアクセスできるデータ(Controlled data;オープンアクセスではないデータ)もあ […]