CATEGORY

R

  • 2026年5月15日
  • 2026年5月15日

中央値による正規化と対数変換

はじめに 遺伝子発現プロファイルでも、タンパク質発現プロファイルでもそうだが、解析していると正規化(Normalization)という操作が必要になる。遺伝子発現解析をしているとそこまで問題になることはないし、遺伝子発現解析にはよく使用されるedgeRやDESeq2では、正規化前後の値を取得出来るのでそこまで考える必要はない。一方、先日書いたCPTACの解析ではしっかりと正規化について意識しなれば […]

  • 2026年5月11日
  • 2026年5月11日

CPTACのデータとRを使ってがんや腫瘍のタンパク質発現量と患者の生存率の関係を解析する(CPTAC, v.4.4, 2024) 

2026/05/11(月);初稿 はじめに これまでTCGA(The Cancer Genome Atlas)に登録された各種がんの遺伝子発現プロファイルと、その患者の生存率(生存期間)を解析してきた。この記事ではCPTAC(Clinical Proteomic Tumor Analysis Consortium)に登録されたデータを使ってがんや腫瘍のタンパク質発現プロファイルとその疾患の臨床情報 […]

  • 2025年12月14日
  • 2026年1月12日

TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関係を解析する(TCGA, v.43, 2025)

2026/01/03(土);初稿2026/01/12(月);追記;AnndataではなくSummerizeExperimentやMultipleAssayExperimentが使えると思う。 はじめに 以前、TCGAのデータを使って、がんや腫瘍における遺伝子発現量(RNA-seqのカウント値)と患者の生存率の関係をRで解析したが、そのときは対応する正常組織(おそらくがんや腫瘍周辺の正常部位)におけ […]

  • 2025年12月14日
  • 2026年1月12日

TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関係を解析する(TCGA, v.41, 2024)

2025/12/14(日);初稿2025/12/29(月);訂正;カプランマイヤー法による生存率の解析;教科書(生存期間解析、ISBN978-4-254-12861-1)に従って、打ち切りの設定を確認し、生存曲線(カプランマイヤー推定値)の横軸を1825日(5年)に限定した。2026/01/03(土);訂正;元の記事のタイトル「TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関 […]

  • 2025年10月4日
  • 2026年1月7日

大きなデータセットのssGSEA2やforeachによるマルチスレッディングのときに突然RStudioが落ちる場合の対処方法

2025/10/04(土);初稿2025/11/08(土);追記;並列化が元から組み込まれているライブラリに対してforeachを使うのはそもそも良くない。 はじめに 以前TCGAやCPTACのデータをダウンロードしたが、最近はこれまで解析を行ってきた解析手順や手法をブログに記録しておくためそのデータを使って色々と解析を行っている。今後のためにと思って、多少無茶な解析でも行っているわけだが、そのと […]

  • 2025年5月8日
  • 2025年12月14日

用量反応関係(dose-response relationship)の測定結果をRのパッケージminpack.lmを使ってヒルの式にフィッティングしEC50を求める

日付;2025/05/8(木) はじめに ある薬剤にして何らかの生物現象、例えば、標的分子の発現量の減少、増殖能の抑制、アポトーシスの発生率等に対する薬効を数値化し、横軸(X軸)に用量(ここではDose)、縦軸(Y軸)に反応性(ここではResponse)をとってグラフ化すると、いわゆる「シグモイドカーブ」という曲線に従うことが多い。特に、あるタンパク質に対するリガンドの結合と、結果して起こるタンパ […]

  • 2025年2月12日
  • 2026年1月7日

edgeRによる遺伝子発現解析・GSEAとclusterProfierによるパスウェイ解析

日付;2025/02/11(火) はじめに 先日、RNA-seqの解析でのFASTQのQC、アダプター除去(アダプタートリミング)、ゲノムへのマッピングの方法を記した。ここでは、それに引き続く解析であるedgeRによる遺伝子発現解析の方法、GSEAを使ったGSEA(Gene Set Enrichment Analysis)、clusterProfilerを使ったOverrepresentation […]

  • 2022年7月16日
  • 2025年9月19日

ggplot2によるボックスプロット・箱ひげ図

日付;2022/07/16(土)Rによるデータ解析(その5) ボックスプロット(箱ひげ図)は、N数が10くらいあり、かつ、そのデータが正規分布していないような、というか、動物実験のデータなんかではとても便利なグラフである。また、エクセルでこのボックスプロットを作成しようとしてもなかなか難しい作図の一つであると思う。N=10くらいのデータでは、データを要約しようと思うと、平均値±標準偏差よりもデータ […]

  • 2022年7月16日
  • 2025年9月19日

ggplot2による棒グラフの作成方法

日付;2022/07/15(土)Rによるデータ解析(その4) 最近では、どうもNatureやCellやScienceだけではなく、他のジャーナルでも棒グラフに個々のデータをいプロットする論文が増えてきた。ジャーナル側からの要求なのか、それともただイキってNature、Cell、Scienceを真似しているだけなのかは知らない。 尚、基礎生物学研究必要なのは平均値と標準偏差であると確信している。そし […]

  • 2022年7月16日
  • 2025年9月19日

ggplot2による折れ線グラフの作成方法

日付;2022/07/15(土)Rによるデータ解析(その3) Rを使っていて便利だと思うことが、時系列のデータ解析だと思う。リアルタイムでデータの推移を見るという目的にはもしかしたら向いてないかもしれない(自分が知らないだけだと思う。)が、2,3日毎に取得してモニターする様な、例えば腫瘍系や増殖能の評価には非常に優れた方法だと思う。エクセルでは、いちいちグループを手作業でまとめて、よくわからんフォ […]