生成AI時代への適応(その1)
生成AIは人間の仕事を大きく変えると言われています。
昨年の今あたりは、いずれそうなるだろうくらいに呑気に考えていたのですが、いやいや、もう既に研究の分野でも大きくやり方の変化が進んでおり、自分たちのやり方を変えて適応させないとまずい状況になっていると気がつきました。
また、そのインパクトも非常に大きい。研究の戦略やテーマの立て方に変化を余儀なくされます。この変化の波に適応できるかどうかで、今後の分野や専門家としての将来が左右されると言ってもよいくらいのもので、危機意識をもたなければなりません。
研究者でなくても、専門家やいわゆる頭脳労働をしている人は同じで、適応しないと淘汰される恐れさえあります。一方、時間がある若い人にとっては非常に大きなチャンスかもしれません。
さて、そもそもそんなゲームチェンジャーである生成AIとは一体何なのか。知っている人には当たり前ですが、なかでも自然言語処理に特化した生成AIの一つであるLLMとは何かについて、少し解説しておきましょう。
大規模言語モデルLLMとは、膨大な量のテキストデータを用いて、トークン化(テキストを単語やサブワードに分割)した単語の並びを学習し、次の単語の予測をさせるというモデルです。予測のために、教師なし学習や人間による追加学習をし、指示に応じて望ましい回答の形式を訓練させて(よい回答に報酬を与える強化学習を行い)、モデルをチューニングします。とにかく人間が一生のうちに読んだり聞いたりする量を大きく超えた膨大な量のテキストを学習させて、単語等の関係のパラメータを調整したモデルをつくることになります。
生成AIの発展において、画期的だったとされるのがTransformerという仕組みの導入です。単語ごとに順番に処理する従来の方法ではなく、文中の単語間の関係性を直接モデル化しました。この仕組みで、今や1兆を超えるパラメーター数をもつモデルがつくられ、非常に複雑な言語パターンを理解し、かつ、出力ができるようになりました。既に、文章作成の能力は一般的な人間のレベルを超えてしまっています。ただし、専門分野に使用するには、生成した情報の正確さにおいてはまだまだ大きな課題が残されています(ハルシネーションといいます)。
なお、正確な情報に基づく推論を行うために、RAG(Retrieval Augmented Generation)という、外部データを検索して情報を抽出し、それに基づいて大規模言語モデル(LLM)に回答させる方法があります。専門知識や特定の事実を回答させるタスクではRAGを用いるのが望ましいそうです。
また、独自のデータを用いて強化学習で訓練(ファインチューニング)し、カスタマイズしたようなモデルもつくられています。法務関係でも書籍数千冊や法令数千件を読み込ませたモデルなどがあります。弁護士の仕事をかなり奪うことになりますね。
人間には記憶の容量や学習の速度など、動物としてのいろいろな制約がありますが、AIはその制約を大きく超えて能力を発揮できます。AIと協働することで、人間の能力を超えて、かなりの能力が発揮できるということになります。
ただし生成AIにも課題があり、複雑な思考の連鎖や多段階の推論、本一冊のような長大な文脈や論理の一貫した理解などはまだまだのようです。データも、人間が扱える分量の情報だと人間の判断にまだまだ利がありますが、得意分野を選べばいろいろできることがあります。また、今後これらが改善され、さらにはモデルの推論過程の説明、事実や正確性の確認などもできていくようになるはずで、今後数年で大幅に改善することも十分考えられます。
得意分野で言うと、AIは要約が得意なので、研究論文の検索+要約サービスが急激に発達しました。
AIは文章作成も得意です。これまでは自分で書くしかなかった文章、人によって文章のうまい下手には大きな差がありました。しかし、今や文章力そのものがなくても、かなりの程度でなんとかなってしまいます。下手でも誰でも、いい文章が書けてしまうということです。そこに差が生まれなくなってしまいました。鍛えた自分としては複雑ですが・・・仕方ないですね。さらにいえば、論理がめちゃくちゃでも、キーワードだけ拾って、AIが勝手に論理的ないい文章にしてしまう、という可能性さえあります。詐欺みたいなものじゃないかと感じてしまいますね。しかしプレゼンだけで見抜くのは難しいでしょう。こういうエセ評論家がこれからかなり増えると思います。でも自分がエセだという自覚はないはずです。悪貨に駆逐されないように、どのようにして差別化するか、という防衛策を真剣に考えておかないといけませんね。
また、既に、英語論文を書くための英語力はかなり不要になりつつあります。きちんと日本語で書いて、それをAIが翻訳したものを英語で読んで、自分の意図と間違っていないことが確認できさえすればいいようになりました。これも英作文に労力を費やした自分としては複雑ですが・・・ありがたくはあります。
いずれにせよ、言語翻訳機能が充実したことで、言語の壁を超えて情報が共有できるようになったわけで、英語圏以外の人間にとっては手に入れられる情報量が爆発的に増えることになって、これは大変有り難いことです。
我々が英語圏以外の海外の事例研究ができるようになったのもこれに関係しています。一昔前、ドイツ、フランス、スペイン、オランダなど、それぞれの国の言語の資料を用いて比較研究するなど、語学の壁によってできなかった訳です。できるようになったいま、急激にフロンティアが広がったわけです。
質的研究の方法、にも大きな変革が生じつつあります。・・・(続きは次回)