ドマさんの徒然なるままに【第88話】 GMPハルシネーション

第88話:GMPハルシネーション

序章
ハルシネーション(hallucination)という言葉、人工知能(Artificial Intelligence:以下、AIと略)の普及と相まって広まったように思える。元々は幻覚を意味する言葉であるが、AIの世界では事実に基づかない情報を生成する現象のことを指す。まるでAIが幻覚を見ているかのようにもっともらしい嘘(事実とは異なる内容)を出力するため、このように呼ばれているようだ*1

SNSを含めネット情報の量が増えたことからか、ChatGTPを筆頭とする生成AIが日々進化しており、GMPの世界においてもAIが活用しうる状況になって来た。ChatGTPについては、2023年4月14日掲載の「第52話:チョットGMP」で少し紹介したが、あれから三年近くが経過した現在、GoogleのGeminiといった一部無料で活用できる他の生成AIも含め、しかもテキストによるものだけでなく、画像や音声によるものも出現し、その用途は議事録・報告書から始まり論文といった資料作成にまで及んでいる。が、100%信用していいかと問われれば、「ちょっと待て!」として疑問を感じる回答や情報が含まれているケースも少なからずある。

そんなこともあり、『勝手にGMP論』シリーズ*2の第16弾として「GMPにおけるハルシネーションっぽいことってあるのか?」ということを取り上げたい。

なお、本話においては、品質に関わるGood Practices全体、具体的にはGMP省令・GQP省令・GCTP省令・GDPガイドライン・治験薬GMP基準の総称として「GMP」と記しているので、その点をご容赦願います。特定のGMPや本来のGMPに限定して言及している場合には、都度具体的に表記を施しているので、その点をご了承願います。


第1章:GMPにおけるハルシネーションってあるのか?
この現象、実のところAIに限ったことではない。現実の世界の中でも結構生じている。例えばGMP省令を読んで、自己都合による解釈をしでかす者がいたりする。特に多いのは、各条文から自分に都合のよい部分を抜き取り、都合よく繋ぎ合わせて解釈するという行為である。当然本来の条文の意図・目的とは異なる意味となってしまう。治験薬GMP基準ともなると、そもそも医薬品開発という情報量が少ない中でのGMP運用であり、その開発段階や目的とする薬剤によって、情報量のみならず情報の質にも幅が出て来る。そんなことから、自社の開発状況や開発品目に勝手にマッチさせる解釈を行い、あたかもそれが要件で正論であるかのように周囲に言いふらし、コンプライアンスに問題はないとして組織全体を洗脳してしまうことすらある(質問や相談として実際に経験している)。

そんなこともあり、ChatGPTとGeminiのそれぞれに「GMPにおけるハルシネーションとしてどんなものがあるか?」と問いかけてみた。それらの回答からポイントを絞って次章以降に私見とともに記す。
 

第2章:GMPにおけるハルシネーションとしてはどういうものがありますか?
GMPのハルシネーションはありますか?

ChatGPTに上記の質問をしてみたところ、
『もっともらしく聞こえるが、実際には存在しない・誤っている情報を事実のように扱ってしまうこと」を指します。人・文書・AIいずれにも起こり得ますが、特に近年はAI利用時のリスクとして強く意識されています。
GMPの文脈でも「ハルシネーション(hallucination)」は起こり得ます。ただし、AI分野で使われる意味と、GMP実務で問題になる意味は少し整理して理解すると分かりやすいです。
以下に、GMPで実務上問題になりやすい代表的なハルシネーションの例を整理します。』
と答えてきた。

ということで、次章以降にChatGPTとGeminiからの回答を整理し、筆者のコメントを付けて紹介する。
ちなみに、水色が生成AIの回答(整理のために一部修正しているが、基本そのまま記している)、黒字が筆者のコメントである。


第3章:規制・法令に関するハルシネーション(最も危険)
【例】
① 「PIC/S GMPに〇〇の条文がある」
  →実際には存在しない
②  「PMDAが必須と要求している」
  →実際はガイドラインレベルで法的拘束力がない
⇒根拠不明の規制・要求事項を「ある」と思い込むパターンですが、結構多いように思います。
 
【問題点】
① 査察・監査対応で根拠条文を示せない
⇒過去、PIC/S加盟にあたりPMDA主幹による地方行政薬務課のモック査察が実施されたことがあり、当時在籍していた会社の製造所がボランティアとして選抜されました。Corporate QAの筆者はオブザーバーとして同席させていただきました。最後に幹事のPMDA査察官から「オフレコで結構ですので何かご質問やコメントはありますか?」とされたので、筆者は「指摘自体はこちらの不備・不足なのでいくつ出されても結構だと思います。ただ、指摘を受けた側としては、それが、例えばGMP省令の第何条の何項なのかを示していただけないと根拠が分からず、改善のミスリードに繋がる可能性があります。」と伝えたことがあります。会場が一瞬静まり返り、参加者全員が一斉にペンを取り出してメモしていたのが記憶に残っています(当時はそんなレベルであったということでしょうか・・・)。
また、他社からの監査を受けた際、監査員やQPからうろ覚えの条文やガイドラインで指摘を伝えられたことが少なからずありました(当人には休憩時に正しい条文・ガイドライン名を伝えました。指摘自体は取り下げられませんでしたが、この会社には正しい認識を有する“やり手”がいるという意識(脅し?)は植え付けられたものと思っています。)
② 過剰解釈、拡大解釈
⇒推奨事項レベル(should)を必須事項レベル(must)として扱ってしまいかねず、ミスリードを誘導し、結果として過剰対応や誤ったCAPAにつながります。
さらに、こういうことがBlind Complianceを助長させる根源となります。
③ 他社事例や査察官の個人的コメントを「公式ルール」と誤認する
⇒あくまでコメントは参考として捉え、自らがリスクベース・サイエンスベースで考えることが大事です。そういう考え方で運用していかないと向上は無理と言わざるを得ません。
また、仲間内にも関わらずにそういったことを吹聴する輩まで出現したりします。
④ 要件の本質を考えていない
⇒規制が「原則主義」であり、具体的な方法を細かく規定していないため、空白を想像(自己都合)で埋めてしまいます。
 

第4章:査察・監査指摘に関するハルシネーション
【例】
① 「必ず指摘される事項」と断言するが、実際には
  ・会社ポリシー
  ・監査員個人の見解
⇒前第3章の「・査察・監査対応で根拠条文を示せない」と「・過剰解釈、拡大解釈」の項目と同じ現象です。
また同様の話は、「第86話:お宅はどうですか?/Part 3(曖昧編)」内の「監査で自社ポリシーを理由に指摘とする会社さん」の項で述べています。ご参考まで。
② 「最近の査察トレンドでは全社的に必須」
  → 一部事例を一般化している
⇒査察・監査対応のプレッシャーから「指摘されたら困る」という心理が生じ、必要以上に厳しい解釈を作り上げてしまう可能性があります。

【問題点】
① 伝聞や過去事例の連鎖
⇒「前任者がそう言っていた」とか「コンサルが言っていた」とか、出典不明のルールが“社内GMP”として固定化してしまう。SOPの形骸化もその例と言えます。
現実問題として、某セミナーでの筆者コメントが、別場所で「こう言っていた」と使われていたことがあります。
② 本質的でない改善にリソースを浪費
③ リスクベース思考の欠如
⇒逸脱や指摘の対応としてのCAPAに多いパターンと言えます。前第3章でも述べたように、自分で考え本質を捉える“クセ”をつけましょう。
 

第5章:SOP・GMP文書作成におけるハルシネーション
【例】
① SOPに
  ・実際には行っていない操作や実際とは異なる操作
  ・設備に存在しない機能
  ・運用実態と異なるフロー
 を「あるもの」として記載
⇒承認書との齟齬や乖離もある意味ではこの部類かと思います。
② AIが生成した手順が現場と不整合
⇒AIにSOPまで作らせているとすれば、製造所自体に問題ありとしか思えませんが・・・。

【問題点】
① 「SOP不遵守」そのものを作り出す
② データインテグリティ(DI)リスク

⇒恣意的なものであれば、営業停止処分は必至と言えます。
③ 伝聞や過去事例の連鎖
⇒前第4章と同じで、「前任者がそう言っていた」とか「コンサルが言っていた」とか、出典不明のルールが“社内GMP”として固定化してしまう悪いパターンですが、結構あると言わざるを得ません。それが長引くと、“負のQuality Culture”と化します。
 

第6章:バリデーション・品質評価に関するハルシネーション
【例】
① 「3ロットあれば必ず十分」
② 「この範囲なら再バリ不要」
③ 「この統計手法がGMPで求められている」
  ※ 実際には「製品特性・リスクに依存」
⇒この手の発想は結構多いように思います。お気をつけください。
ちなみに、米国FDAやEU-GMP(PIC/S GMP)のPVの考え方としてはContinued/Ongoing Process Verificationが求められているということをお忘れなく。

【問題点】
① 科学的根拠(Scientific Rationale)の欠如
② 査察や監査時に説明不能
⇒委託先監査等において、経験的にも(バリデーション関係に限らず)この部類に起因する指摘はかなり出させていただいています。
 

第7章:逸脱・CAPA原因分析でのハルシネーション
【例】
① 実測データがないのに
  ・「〇〇が原因と考えられる」
② 相関と因果を混同
③ 「ヒューマンエラー」と安易に断定
⇒率直に申し上げて、監査でこれらの観察事項は異常なほど多いです。特に、OOSでの(根拠不十分にも関わらず)ラボエラーとしての理由による再試験は多いと言えます。

【問題点】
① 再発防止にならないCAPA
② 同様の逸脱が繰り返される
⇒Root Cause Analysisが出来ていないことが真の原因です。
自己点検における指摘改善の先送り(Due dateの延長)は、この手の状態を助長させることになります。
 

第8章:データインテグリティ(DI)に関するハルシネーション
【例】
① 「電子署名があるからDIは問題ない」
② 「セキュリティはIDとパスワード管理しており問題ない」
③ 「バックアップがあるからALCOA+は満たしている」
④ 「コンピュータと紙のハイブリッド運用で問題ない」
⇒自分たちは妥当と思っているようですが、第三者からは言い訳にもなっていないと映ります。
ハイブリッドとしている場合、コンピュータと紙のいずれが原本なのか? そもそもいずれであってもDIは求められるはずです。


【問題点】
① ALCOA+の概念誤認
② システム運用、権限管理の本質的欠陥を見逃す

⇒専門家の意見も踏まえて、第三者の目線で見直すべきでしょう。


第9章:AI利用時に特有のハルシネーション
【典型例】
① 実在しない
  ・ガイドライン
  ・事例
  ・規制当局コメント
  を“引用風”に生成
② 「一般的にGMPでは〜」という曖昧な断定
⇒ここでの典型例、AI利用時に限らず現実においてもかなり当たっています。お気を付けください。
さらに言えば、研修会等での行政査察官等の講演では、最初に「あくまで個人の見解であって、行政としての見解ではありません」といった免責コメントがなされていると思います。

【特に危険な使い方】
① 一次情報(法令・原文)を確認せずに採用
⇒現実において嫌というほど味わっています。特に米国FDAのガイドラインやPIC/S GMPの和訳といったもので、英語原文で読み解いたといった方は極めて稀です。
《注》厚生労働省発出の和訳版には(tentative:仮訳)と明記されており、免責と理解すべきでしょう。
② 生成文をそのままSOPや報告書に転記
⇒現状ではほぼ無理です。あくまで参考、叩き台として活用し、必ず自身で確認し仕上げましょう。
 

第10章:ハルシネーションを防ぐための実務的対策
【個人・組織レベル】
① 「出典は何か?一次情報か?」を必ず確認
② 条文番号・原文確認を習慣化
③ 「must / should / may」を意識
⇒GMP関係者にとって必須と思います。
敢えて言わせていただきますが、査察官や監査員の方、偉そうに指摘した根拠や出典が曖昧だと貴方のレベルが疑われ、被監査製造所の向上に対して逆効果になる可能性があります。

【AI利用時】
① AIは
  ・参考
  ・叩き台
  ・論点整理
  までに限定
⇒“言わずもがな”と言ったら失礼でしょうか。前第9章の筆者コメントのとおりです。
② 「根拠条文を列挙せよ(不明なら不明と書け)」と指示
⇒これを実行させても完全なものを求めることは現状ではほぼ無理と言えます。本話のChatGPTとGeminiの(複数回実施した)回答についても???なものが混在しており、筆者なりに整理しています。
ちなみに、この種の指示については、後述の第13章に示した「RAG」や「プロンプトエンジニアリング」を参照のこと。
 

第11章:GMPにおけるハルシネーションのまとめ
① GMPにおけるハルシネーションは
  ・「もっともらしい誤り」が「コンプライアンス違反」や
  ・「品質リスク」に直結する点が最大の危険
⇒ChatGPT、かなり精度が高くなっていますが、現状では使い方を誤るととんでもない結果を招くことになると断言できます。
② 必要であれば、
  ・査察対応
  ・AIを使ったSOP作成時の注意点
  ・ハルシネーションを前提にしたAI利用ルール(GMP向け)
  なども具体例付きで整理できます。
⇒そう言ってきましたが、本話の主旨から逸れていくと考え、以降の調査は実行しておりませんので、悪しからずご了承ください。
 


第12章:なぜ都合のいい解釈をしたがるのか?
さて、本話での本題は、AIのハルシネーションではなく、現実のGMP運用におけるハルシーションである。では、「人はなぜ都合のいい解釈をしたがるのか?」という疑問から整理しよう。一番分かり易いのは、SNSでの“バズり”であろうか。そもそもで申し訳ないが、「自分が知りたい情報だけを検索している」という状態になっていませんか? ネットで得た情報が自分の考えに都合よくマッチするものばかりであれば、それはバイアスがかかっている可能性がある。このような情報収集を「エコーチェンバー現象」*3と呼び、自分に都合の良い情報だけを集めることで、物事の本質を見失うことがある。フェイクニュースの拡散などはその例である。また、その際のバイアスを心理学的には「認知バイアス」という。心理学における「認知バイアス」とは、人間が情報を処理するときに偏りが生じる現象を指す。「認知バイアス」は、さらに「確証バイアス(confirmation bias)」、「自己奉仕バイアス(self-serving bias)」ならびに「楽観バイアス(optimism bias)」に分類される*4

GMPにおけるハルシネーションは、今まで述べてきたように、「思い込み」「過剰解釈」「根拠なきルール化」といった実際のリスクより形式や伝説を優先したときに起こりやすいと言える。一方で、GMPの本質は患者リスクを品質リスクとして捉え、科学的・合理的に管理できているか否かが問われる。では、どうすればGMPハルシネーションを回避 or 低減できるのだろうか。


第13章:GMPハルシネーションを回避 or 低減するために
「インターネットも使わず、ましてAIも使わないで、自分で調べて考えなさい!」なんて、身も蓋もない言い方をしたら叱られるでしょうね。インターネットは強力な情報源であり、AIは業務効率を上げるのに役立つのは事実である。使い方によっては、かなりの部分をAIに任せることも可能であろう。ただ、一度その利便性を味わってしまうと、どんどん深みにはまり、手放すことは出来なくなってしまうのが人間の性である。

問題は、それをどう活用するかである。情報の信頼性を確認し、バイアスを避けるように意識することが求められるということである。情報を正しく収集するために、その元情報や出典を遡及して調査し、冷静になって他の視点を取り入れることが、より深い知識を得るための鍵となる。コンピュータについてもAIについても全くの素人の筆者ではあるが、ちょっと調べてみた。現時点では、以下のようなやり方があるようだ。

例えば、対策アプローチとしては、RAG(Retrieval-Augmented Generation:検索拡張生成)*5といった情報検索と生成AIを組み合わせることで、自社データを根拠にした高精度な回答を実現する技術もある。GMPで言えば、AIに自分の知識で答えさせるのではなく、社内の信頼できるSOP(元がいい加減であれば、当然ダメである)や規制ガイドラインのみを参照して回答させる技術である。

また、プロンプトエンジニアリング*6といった生成AI(ChatGPTなどの大規模言語モデル)に対して、適切な指示や条件を与えることで、期待するアウトプットを得るためのスキルや技術もある。要は、「わからない場合は『わからない』と答えること」「必ず参照元の条文を明示すること」といった制約をAIに与えることで精度を上げることである。ついでに言えば、評価用データセットの作成として過去の正解データを用いて、AIがどの程度の頻度で誤情報を出すかを定量的に検証(性能評価)といったことも考えられる(まさにPerformance Qualificationである)。

さらに、human-in-the-loop(HITL)*7と称される、AIシステムにおいて人間がプロセスに介入して適切な判断を行うことで、AIの学習データを増やし、システムの精度を継続的に向上させる仕組みもある。GMPで言えば、AIの回答をそのままプロセスに流さず、必ずその道の専門家やQAなどが照査・承認する工程を設けるといったことも考えられる(QAの業務が益々増えるが、その質が問われると思ってくださいな)。


終章
以上、現実のGMPの世界におけるハルシネーションについて述べた。一方で、AIの世界、生成AIのみならず、自立型AIや自律型AI*8も出現し、実際の製造現場でも一部活用されているようだ。人工知能AI、確かに便利なツールである。しかし、便利だから使うということと、自分で考え、判断し、決定するという本来の人間としての頭脳を使うということとをごちゃ混ぜにして欲しくない。GMPの世界において、AIをどんなに活用したとしても、AIを使うということの判断や決定は、ご自身に委ねられており、最終的な責任は常に人間(製造販売業者や製造業者など)に帰属し、その結果は自身に降りかかるということを忘れないで欲しいし、それを願っている。

ちなみに、今回の検索において、Geminiは最後に『AIの出力を「鵜呑みにしない」仕組みづくりが、ハルシネーション対策の第一歩です。』と答えてきた。まだ救いがあると感じている。


では、また。See you next time on the WEB.



【徒然後記】
新たな三国志?
中国の三国時代、広義では黄巾の乱の勃発(184年)から西晋による中国再統一(280年)までを指し、狭義では後漢滅亡(220年)あるいは三国が分立した229年から蜀漢が滅亡した263年までを指すとされる。三国志は、その三国時代にかけて群雄割拠していた魏・呉・蜀の興亡史(歴史書でもある)である。読者の中にも書籍として、あるいは横山光輝の漫画で読んだことがある方も多いかと思う。
現在の米国・中国・ロシアの三国の動きを見ていると、地球を三分割したいのかと思えてしまう。「俺が一番だ! 俺の国が一番だ!」「この土地は、元々は我が国のものだ!」なんて言い張ったり、「我々が買い取るぞ!」なんて言ってたりする。歴史認識なる言葉もあるが、そもそも「その歴史って、いつのことを言ってるんだ?」なんて思ってしまう。「歴史を学び、同じ過ちを繰り返さない。」なんて言葉、彼らの辞書には無いのかもしれない。そもそも人類の歴史まで遡れば、現在のアフリカ大陸で人類の祖先が誕生したと言われており、そうだとすれば、米国・中国・ロシアの三国どころか、地球人全員みんな兄弟なんじゃね? と思ってしまう。
地球自体、筆者の子供時代の感覚からすると、かなり縮まってしまったような感じを受ける。「国がどうのこうのなんて言わず。One Earthの地球人としてみんなで仲良くシェアして使えば?」なんてバカなことを考えたりする。そうすれば「戦争のない平和な地球になるんじゃないか?」なんておバカな考えをする者が増えたらいいな、なんて思っている。「宇宙から見れば、地球人も宇宙人」なんて歌もあったような。筆者、同感でございます。

--------------------------------------------------------------------------------------

*1:参考 https://www.nri.com/jp/knowledge/glossary/hallucination.html

*2:直近、第15弾の 『勝手にGMP論』シリーズは、「第83話:GMP界隈」です。

*3:佐藤広英「インターネットにおける情報の選択」 認知科学第31巻第4号(2024) pp.670–677
https://www.jstage.jst.go.jp/article/jcss/31/4/31_2024.040/_pdf/-char/ja

*4:「都合のいい解釈の正体:認知バイアスと脳科学から見る人間の思考」
https://note.com/93lead_wakuwaku/n/n9de295356755
https://knowledge.awaisora.com/2025/06/18/390ff8ed-d459-4f1b-8be8-d2e00950b3db/

*5:参考 https://www.persol-group.co.jp/service/business/article/20077/
   https://gruff.co.jp/blog/rag-to-know-what-it-is

*6:参考 https://qiita.com/kskt55/items/2c04af4edade823947ac
   https://generative-ai.sejuku.net/blog/690/

*7:例えば、PIC/S GMP「Draft guidelines: New annex 22 - Artificial intelligence」内にも“Human-in-the-loop”の記述がある。
https://picscheme.org/docview/9715

*8:自立型AIと自律型AIについては、一言でいうと以下の通り。
・自立型AI(Self-supporting AI):人の支援なしでも単独で使えるAI
・自律型AI(Autonomous AI):自分で判断・行動を決めて動くAI
参考 https://ai-kenkyujo.com/news/jiritsugata-ai/
   https://www.netbot.jp/jiritugataai/
《注》自律型AIについては、「責任主体が不明確であり、原則として直接の品質判断には使えない」とAI自身が認めていることを申し添えておく。

 

 

執筆者について

経歴 ※このプロフィールは掲載記事執筆時点での内容となります

連載記事

コメント

コメント

投稿者名必須

投稿者名を入力してください

コメント必須

コメントを入力してください

セミナー

eラーニング

書籍

CM Plusサービス一覧

※CM Plusホームページにリンクされます

関連サイト

※関連サイトにリンクされます