Rによる相関係数の算出、線型回帰（単回帰）とその表示

2026年5月17日
2026年5月20日
R
abline(), linear regression, lm(), plot(), R, 単回帰, 相関係数
25view

2026/5/17（日）；初稿

1 はじめに
2 散布図と単回帰直線
3 相関係数の統計値の取得
4 まとめ

はじめに

気づいたときに何の前触れもなく、パッと行う必要がある解析として、相関係数の算出がある。しかし、これも計算しては忘れることを繰り返している様に思う。依って、ここに覚書しておく。以下はデータフレームdfの列column1と列column2の散布図を描き、そこに単回帰（y = ax +b）を求めて、それを散布図に重ねるためのRのコードである。単回帰と相関係数は、使用する目的が違うので、これらの用語を使うときはちょっと注意かも知れない。単回帰は、従属変数（観測値、x）による目的変数（結果、予測値、y）の予測、相関係数はyとxの関連性である。ただし、計算的には一致するはずなので、以下のプロットで相関を求めたと言える。

散布図と単回帰直線

以下のコードが切片が任意の数値の場合である。

plot(x = column1, y = column2, data = df, main = "linear regression")
abline(lm(column1 ~ column2, data = df), col = "blue")

plot(x = column1, y = column2, data = df, main = "linear regression")
abline(lm(column1 ~ column2, data = df), col = "blue")

以下が切片を0にする場合である。

plot(x = column1, y = column2, data = df, main = "linear regression")
abline(lm(column1 ~ column2 - 1, data = df), col = "blue")

plot(x = column1, y = column2, data = df, main = "linear regression")
abline(lm(column1 ~ column2 - 1, data = df), col = "blue")

もし、対数変換した方がよくフィットするようならば、目的変数を対数変換すれば良い。それを単回帰に使用する場合、それらは対数変換されていることを忘れてはならない。

対数	対数	Rによる演算
自然対数	ln	log(df$column2)
常用対数	log10	log10(df$column2)
底2の対数	log2	log(x = df$column2, base = 2)

相関係数の統計値の取得

解析中に思いついたようにパッと単回帰する場合は、例えば、そのspoleや切片だけが必要ってことも多い。それらを取得するためには、lm()の結果から直接それらを取ってくれば良い。

result_lm <- lm(column1 ~ column2, data = df)
result_lm$coefficients[1] # this is intercept
result_lm$coefficients[2] # this is slope
summary(result_lm)$r.squared # R^2 value
summary(result_lm)$coefficients # shows intercept, slope, p-value and more.

result_lm <- lm(column1 ~ column2, data = df)
result_lm$coefficients[1] # this is intercept
result_lm$coefficients[2] # this is slope
summary(result_lm)$r.squared # R^2 value
summary(result_lm)$coefficients # shows intercept, slope, p-value and more.

まとめ

lm()は遺伝子発現解析のQCなどに有用であり、それだけではなく色々なところで思い立ったように出てくる関数と思う。これだけの簡単な関数なのに、一瞬で忘れてしまうほど自分の頭は笊である。困ったものだわ。

Prev

2026年5月15日
中央値による正規化と対数変換
Next

記事がありません

この記事を書いた人

Kats

これまで放射線治療の基礎研究、乳がんの遺伝子診断に関する研究に携わってきました。また、アメリカではポスドクとしてトリプルネガティブ乳がんに対する新規分子標的薬の影響に関して研究をしてきました。２０２２年から改めて日本で研究活動を再開することになりました。このブログでは日頃の研究活動から学んだことや考えたことを記録していこうと思います。多くが愚痴になってしまうかもしれません。この記録が自分の忘備録として、そしてすこしでも誰かの参考になるようであれば、それでいいんじゃあないかと思っております。

投稿一覧へ

運営者について