CATEGORY

解析

  • 2025年12月14日
  • 2025年12月14日

TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関係を解析する(TCGA, v.41, 2024)(正常組織のバイオリンプロットなし、GDC portalからのデータのダウンロード方法なし )

2025/12/14(日);初稿 はじめに 以前、TCGA(The Cancer Genome Atlas)に登録されたデータをダウンロードしたが、ここではTCGAのデータを使って各疾患毎の患者の生存率をカプランマイヤー法により解析する方法を述べる。これらはがんや腫瘍の遺伝子発現や遺伝子変異とそれに紐づく患者の情報であり、他の解析(基礎実験など)で疾患に関連しそうな遺伝子やタンパク質が見つかった場 […]

  • 2025年10月4日
  • 2025年11月8日

大きなデータセットのssGSEA2やforeachによるマルチスレッディングのときに突然RStudioが落ちる場合の対処方法

2025/10/04(土);初稿2025/11/08(土);追記;並列化が元から組み込まれているライブラリに対してforeachを使うのはそもそも良くない。 はじめに 以前TCGAやCPTACのデータをダウンロードしたが、最近はこれまで解析を行ってきた解析手順や手法をブログに記録しておくためそのデータを使って色々と解析を行っている。今後のためにと思って、多少無茶な解析でも行っているわけだが、そのと […]

  • 2025年5月8日
  • 2025年12月14日

用量反応関係(dose-response relationship)の測定結果をRのパッケージminpack.lmを使ってヒルの式にフィッティングしEC50を求める

日付;2025/05/8(木) はじめに ある薬剤にして何らかの生物現象、例えば、標的分子の発現量の減少、増殖能の抑制、アポトーシスの発生率等に対する薬効を数値化し、横軸(X軸)に用量(ここではDose)、縦軸(Y軸)に反応性(ここではResponse)をとってグラフ化すると、いわゆる「シグモイドカーブ」という曲線に従うことが多い。特に、あるタンパク質に対するリガンドの結合と、結果して起こるタンパ […]

  • 2025年3月16日
  • 2025年9月9日

Uniprotでタンパク質のMSA(Multiple Sequence Alignment)を行う

日付;2025/03/16(日) Uniprotを使った簡単なMSA(Multiple Sequence Alighment) 仕事で現在行っているプロジェクトが一段落しそうな雰囲気が出来てきた。この仕事をやりきった上で今年の7月に夏休みをとろうって感じになっている。そして、そのプロジェクトが一段落する時点で、タンパク質-タンパク質相互作用(Protein-Protein Interaction; […]

  • 2025年2月12日
  • 2025年12月20日

edgeRによる遺伝子発現解析・GSEAとclusterProfierによるパスウェイ解析

日付;2025/02/11(火) はじめに 先日、RNA-seqの解析でのFASTQのQC、アダプター除去(アダプタートリミング)、ゲノムへのマッピングの方法を記した。ここでは、それに引き続く解析であるedgeRによる遺伝子発現解析の方法、GSEAを使ったGSEA(Gene Set Enrichment Analysis)、clusterProfilerを使ったOverrepresentation […]

  • 2025年1月11日
  • 2025年3月25日

RNA-seqの解析におけるFASTQのQC・アダプター配列の除去・マッピング・リードカウントの方法

日付;2025/01/11(土)、2025/01/30(木)タイトル修正 はじめに 小さな研究室やアカデミックではRNA-seqの解析のためにN=5で2グループ取ることができれば上等で、経費を抑えるためにN=3や、最悪ではあるがN=2や1で解析を計画してしまうことも少なくないように思う。しかし、今回はそういうことはなく、N=5で合計40サンプルで行うことができた。しかし、こういった場合はやはり一連 […]

  • 2024年12月8日
  • 2025年11月8日

cellranger countがメモリ不足で止まる場合の対処方法

2024/12/7(土);初稿2024/12/10(火);SWAPパーティションの導入によりSWAPが動くようになった。2024/12/12(木);結局キャシュの定期クリアを設定する。2024/12/22(日);ちゃんとSWAPが利用されていた。 2025/09/28(日); crontabのところを訂正。 はじめに 最近、新しいPCでcellranger 9.0.0を使い出した。cellrang […]

  • 2024年10月27日
  • 2025年3月25日

pdc-clientを使ってCPTACの公開データをダウンロードする

日付;2024/10/27(日) はじめに 最近では、ナノポアシークエンサーでアミノ酸配列まで読めるようになってきた。これはつまり、プロテオームもハイスループットで読める時代がもうそこまで来てるってことである。現時点ではマルチプレックスのプロテオームはRNAシークエンスの価格の10倍くらいするので、なかなか手を出せる物でもない。しかし、こうやってハイスループットのタンパク質発現解析方法が開発されれ […]

  • 2024年10月27日
  • 2025年3月25日

gdc-clientを使ってTCGAの公開データをダウンロードする

日付;2024/10/26(土) はじめに TCGA(The Cancer Genome Atlas Program)は公的データベースであり、誰でも利用可能である。トランスレーショナルスタディーや、それに限らず基礎研究に対してもこんなに有用なものはない。オープンアクセスのデータだけでなく、限られたユーザーがアクセスできるデータ(Controlled data;オープンアクセスではないデータ)もあ […]

  • 2024年6月23日
  • 2025年10月19日

RによるssGSEA(single sample Gene Set Enrichment Analysis)とその方法

日付;2024/06/23(日)、2025/04/03(木)ssGSEA2に使用するGCTファイルについて追記 はじめに これまでにBroad instituteのGSEAによりGSEAを行う方法をそれぞれ複数サンプルからなる2群間比較の場合と1群のみの場合について書いたが、ここではRを使ってsingle sample GSEA(ssGSEA)する方法を述べる。ちなみに、以前書いたBroad in […]