2025年12月25日更新版
LLMでもCLMでもない生成AI版MLMとRAG活用
はじめに
LLMとはLarge Language Modelの略で、大規模言語モデルのことであり、公開情報です。
CLMとは当社が2023年4月に名付けたConfidential Language Model(又はCompany
Language Model)の略で機密情報(又は社内情報)です。
これらのいずれにも属さない情報に会員内での情報や新聞・書籍等の有料販売情報があ
ります。これらは著作権を持っている情報が殆どです。
これらは無断で生成AIの学習データとしてRAG対象にすることは出来ません。
しかし、生成AIの利用者からしたら、利用目的によっては、そこに境界を設けたくないのも
本音と思われます。
ここでは、それら生成AI版MLM(Membership Language Model又はMiddle Language Model)
について、議論の場を設けたいと思います。
2025年12月27日作成
本編
CLMとLLM、中間(Middle)に位置する生成AI版MLMの関係
下図のように、当社ではCLMとLLMの関係を定義して最適回答を
得る仕組をGPBと呼んでおり、専用ツールも開発しています。
本ページで扱う生成AI版MLMは、CLMとLLMの中間に位置し、
著作物として保護されており、機密情報でも完全公開情報でもあ
りません。
生成AI版MLMの取扱い
現在世界各地で有料販売情報の生成AI活用について訴訟問題
が起きています。
当社生成AIツールはCLMとLLMを扱うので、生成AI版MLMには
直接関与しませんが、LLMの開発会社がRAG等の技術を使って
LLM扱いしてしまうと、無意識に巻き込まれないとも限りません。
これらを解決する為には双方の歩み寄りや双方機会損失を供わ
ないビジネスモデルが必要ですが、当社としては、これらに接触
しないユースケースに注力したいと考えています。
関連サイト
カタログ AAC生成AIツール”GPB”のご紹介(印刷用)
生成AI経緯 AAC生成AIヒストリー
動画サイト AACYouTubeサイト
