日付;2024/05/19(日)
昨日、ChatGPTに課金してしまった….ということで、もうChatGPTは日常生活に欠かせないよっていう話を書いておこうと思う。
最近のChatGPT
これまでの20年間くらいはGoogle検索がインターネット界隈を支配してきたわけだが、最近ではインターネットの検索はChatGPTに置き換わりつつある。実際、ここ最近は、特に専門的な用語や疎い理論や原理を知りたかったりした場合は、本当にChatGPTばかりに聞いている。そしてついに、「もうすこしでFreeで使えるGPT4の上限やで!!」的な警告まで出てきてしまい、躊躇せずに月20ドルの課金に手をだしてしまった。月々のサブスクリプション代も増えてきているので、代わりにHotspot shieldのサブスクリプションを止める、ということになってしまった。そのくらい、研究的なことをやっているとchatGPTの破壊力を実感することが多い。個人的にはこれが無くなったら、検索の効率などだけを見てもかなりの痛手であるように思う。一般的に考えれてみると別にchatGPTを使えていなくてもどうということはないのだろうが、もし競合相手がこのような情報ツールを駆使しており、一方こちら側がほぼ手動の10年前の情報ツールしか使っていないのだとしたら、もはやどちらに分があるのかは火を見るより明らかである。
一方、Googleの現状としては、正直かなり酷いのではないかと思う。Googleで検索しても、表示されたサイトのSEO対策が完璧なために、こちらのクエリの単語がたった一言載っているだけの全く情報として価値のないサイトがほとんどである。初めて使うライブラリについてGoogleに聞いてみても、ほとんどがマニュアルを単になぞっただけで、あたかも自分が全部一人で書いた的にイキっているブログもである。本当にビ\\**\\ソのゴ*である。その他は、本家のホームページよりも検索で上位に表示されている、あたかも本家のように表示している詐欺サイトがトップ10ランカーである。こんな状態ならばあと10年も経てば検索でgoogleが使用される時代は終わっているだろうと予想できる。Google検索がそんな状態なので、もし何かの理屈に関する一連の調べ物をGoogle検索で行った場合、単語を入力して、実際にサイトに行き、サイトを読んでみて、食えるか食えないかを自分でチェックして、そしてそれが食えるサイトならばそれを読んで自分でまとめる、という段階を踏むことが多い。ChatGPTならば、今の所一発でまとめてくれる。当然、Hallucinationとか、そういった正確性に乏しいことはチェックする必要があるが、これまでにGoogle検索で行ってきたことはChatGPTを使うことで遥かに効率的に行うことができるのは間違いがない。
そんなわけなので、個人的にchatGPTでどんな検索が強いのか、以下に書いてみた。
ライブラリ・パッケージ・正規表現の使い方
初めて使うRのライブラリやpythonのパッケージの一般的な使い方を聞くのは、あまりにも強力である。例えば、自分で読み込んだPDFファイルをOCR(Optical Character Recognition)にかけて文字におこし、それをLLM(Lerge Languege Model)で学習させるにはどうしたら良いか、とか、融合遺伝子をCircle plot上で表示するにはどうしたら良いか、とか、そういう質問をすると、RやPythonのスクリプトまで返してくれる。これをGoogle検索でやろうとしたら、最初に書いたように、まずはウェブサイトがまともなことを書いているかどかのチェックから始まるわけである。正直、現時点ではこのような使い方が一番多いような気がする。だって、ライブラリやパッケージのマニュアル読むよりも明らかに早く問題を解決できる。
あと、これが個人的に最強だと思うことが、正規表現によるAwkやSedの入出力についてである。正直、このあたりって知っていれば本当に強いのだろうけど、如何せん勉強する気になれない。Awkくらいならなんとかなるような気がするが、問題は正規表現である。なんだあれ。なんであんなことになってんだ??本気で意味わかんねえ。ということで、こんなものは自分で考えるよりchatGPTに出力してもらったほうが正確であり、時間的にも圧倒的に効率がよい。
自分の知らない一般論
知らない一般論を聞くもGoogle検索とは一線を画す使い方であると思う。やっぱり、一連の調べる過程を全部やってくれて、完結にまとまっているところがすごくよい。例えば、RNAシークエンスのNormalization(正規化)の方法のうち、TMM(Trimmed Mean of M-values)法について教えてくれ、とか、そういった質問である。やっぱり、完結に返してくれるので自分で調べるよりも効率良く学習できる。凄いと思ったことが、RNAシークエンスの正規化の方法のベンチマークを行った論文をPubmedから引っ張ってきてくれるか?みたいなクエリにも対応する。
教科書を単に読んでるだけでは、専門性が寄っていて知ることが出来ないような内容も出力してくれる。例えば、Welch’s t testとMan-Whintney U testではデータがどんな分布に従うときに使えるのか、とか、それらが両方とも適応になるような場合はどんなときか、とか、そういった実際の使用例に近いような質問にも対応できる。こんなこと、Googleで調べようと思ったらかなり大変な気がする。
知らない用語
自分が長年関与してきた分野以外では、知らない用語なんてのは数限りなくあると思う。個人的に用語という観点でイラッとすることとしては、やはり企業関連のイキった略語だろう。あれ、使っている奴ら本気なのか?ダサいと思わないのか??なんでそこだけ英語やねん。キッッショイねん。ほんで中身スッカスカのペラペラやねん。なんとかしてくれや。
そういうイキった用語を調べるのには本当に役に立つ。あんなにイキって使っているクセに、いざGoogleで調べてみると一般的じゃなかったりしてヒットしなかったりするから。そういうときにこれを使うと、雰囲気だけでも掴むことができる。はっきり言えば、使っている企業のイキり人たちもフワッと使っていたりして、本当の意味なんか理解していない場合があるので、そのくらいの正確性で全く問題はない。
趣向品のレビューを聞く
これも個人的に非常に楽しく使っているところである。特に、よく知らない銘柄の酒とかビールとかのレビューは本当に面白い。だって、それっぽいことを返してくれるから。正直、こういった検索になってくると一体何が正しいかわからないが、実際に酒やビールを飲んでみたときの感想と、ChatGPTが返してきた内容が一致しているのかどうなのかチェックしてみたりする。特に一人で酒飲んでいるときなんか、これをやっていると中々に楽しい。というか、随分と陰気な楽しみ方である我ながら。
ChatGPTを使う上で必ず注意しなければならないこと
明らかに有用なChatGPTであるが、やっぱり要注意なことも多い。それが以下である。詳しくは以前の記事の通りであり、今でのその内容の重要性は変わっていない。
情報漏洩
流石にプライベートな個人情報、生データ、患者データ、その他、機密性が高い情報のChatGPTに流すのは絶対にやめたほうが良い。プロンプトの設定でサーバーに残さないように出来るようだが、サーバー上では大丈夫でも、有事のときには会社や所属先から容疑をかけられるのは間違いない。Chatとかいう名前が付いているのでそういったイメージは薄いのかもしれないが、こちらの情報をChatGPTのサーバーにアップロードするという感じに近いような気がする。そして、そのアップロードされた情報な何かの拍子にどこかで使用されてしまうためである。それに最新バージョンのChatGPT(2024年5月19日の時点でGPT-4o)ではどんどん新しい情報がアップデートされているらしい。つまり、得られた情報がどんどん使用されているっていうことである。
正確ではない情報を真に受けること
何かのソースコードやスクリプトなんかでは明らかであるが、帰ってきた情報が正しいなんていう保証は全くない。むしろ、どこか間違えていると考えたほうがよい。それは文字の並びが統計的に尤もらしいってだけである。なので、いくらこういったサービスがGoogle検索を凌ぐといえども、やっぱり出力をそのまま仕事に使うというのはやめたほうが良いように思う。
結局論文は自分で拾ってきて自分でまとめる必要がある
ChatGPTに慣れてくると、どうしても欲しい内容の論文をインターネットから拾ってきてもらったり、要約をさせたくなる。しかし、今の所、自分の求めるほどの内容は出力されたことがない。おそらく、教科書レベルや一般的なレベルの内容であるならば、ChatGPTはGoogleで自分でせっせと調べるより圧倒的にクオリティーが高いようにも思える(ちなみに、これがHallucinationというヤツに陥る根本的な原因の一つと思われる。)が、やはり何か物足りない。自分ではある程度理解した上で論文をまとめていないので、出力内容が深くない。出力を見て思うことが、「だろうね。で??」となる感じである。それに、Pubmedで数時間も調べれば圧倒的に良い内容の調べ物になる。そのあたり、まだまだだと思う。
まとめ
ということで、もうChatGPTが無くてはならない存在になってしまった。最近はGoogle検索は自分がよく知っている情報を調べるときにしか使わない気がする。その理由はやはり、詐欺的にSEO対策が完璧なサイトがトップランクに来ており、そのサイトには全く有用な情報が載っていないためである。だから、自分の良く知っている分野ならばGoogleで調べても困惑しないっていうことになっている。概要を出来る限り効率的に調べて理解する場合は圧倒的にchatGPTである。
というか、Google検索でトップにくる詐欺みたいなサイトは、本当になんとかしてほしいところである。下の写真を見ればわかるが、Google検索に”chatgpt”って入れてOpenAIのオフィシャルなChatGPTが出てくるのは、4番目だから。上位なんて全部広告。GPTを使っているかもしれないけど、完全に偽物。どうかしている。