「[[Open棟梁 wiki>https://opentouryo.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。 -[[戻る>FrontPage]] --[[設計のポイント]] --[[PMのポイント]] --ナレッジ生成用プロンプト *目次 [#h8399e37] #contents *概要 [#e32a91c8] **生成AIを使用してドメイン・ナレッジを生成したい。 [#ndfcb8e3] 元々、Wikiのリバースでドメイン・ナレッジを生成しようとしていたが、[[基本的な専門知識は生成AIが保有している>#r9f042ad]]事が解った。 **基本的な専門知識は生成AIが保有しているから... [#r9f042ad] -一般知識からフォワード(情報の比率や重みをドメイン・コンテキストで調整してドメインに特化)できるのでは?と言う仮説。 -(AIが保有していない知識は、組織内の独自情報(ルールなど)と、[[暗黙知>#qb34792a]]ぐらいではないか?と考える。) -このドメイン・コンテキストを「細分化された[[ドメインに適合>#kcc6ed6e]]させるための情報の比率や重み」のコンテキストとして渡す。 -このドメイン・コンテキストで「細分化された[[ドメインに適合>#kcc6ed6e]]させるための情報の比率や重み」を調整する。 >※ ドメイン・コンテキストと言う造語は「生成AIが保有している一般知識をドメインに特化させるためのコンテキスト」の意 -必要に応じ、ドメイン独自のルール(定義)を加え、完全に[[ドメインに適合>#kcc6ed6e]]させる。 >※ [[この仮説は、Wikiのナレッジから(先ずは)手動で生成されたドメイン・コンテキストを用い大枠、検証できた。>#sabc4f84]] ***暗黙知に付いての定義 [#qb34792a] -AI(言語モデル)自体が暗黙知の一例を説明できるのはコーパスから学習した事を意味する。 -暗黙知は本質的に形式知化が不可能な部分もあるが(例:直感やセンス)。 -形式知化できないというよりも(、部分的に)、形式知化されていないケースが多い。 -コレには、言語化し難いという側面に加えデータ化されていないと言う側面がある。 -特に、データ化がコスパ観点やモチベーション観点の側面から促されないケースが多い。 --コスパ観点:形式知化がコスパ的に合わない --モチベーション観点:形式知化がデメリットになるなどで動機がない。 -ソレ以外に、非言語的、組織文化、認知の壁、状況依存性などが関係している。 --非言語的:感覚や身体動作など、言語では捉え難く、データ化に専門知識が必要 --組織文化:経験を形式知として残すことの価値の認識がない場合 --認知の壁:「自分のやってることが特別だ」との価値の認識がない場合 --状況依存性:文脈依存で場合分けが多く、一般化・共有が難しい。 ***ドメインに適合させるイメージ [#kcc6ed6e] |#ref(ChatGPT_Image_20250409_1.gif,left,nowrap,集合,30%)|#ref(ChatGPT_Image_20250409_2.gif,left,nowrap,集合,30%)| |CENTER:イメージA|CENTER:イメージB| 結構、良い絵が出たのでプロンプトをメモ 以下のような言語モデル生成AIの画像イメージを生成してください。 ・情報が空間(2次元散布図)上に散らばっているものとします。 ・プロンプトで2次元の集合から情報を抽出します。 ・プロンプトを追加する事で2次元の集合に次元を追加し3次元の集合から情報を抽出します。 ・集合からの情報抽出イメージは1つのプロットではなく複数のプロットを含む集合をポイントします。 ・3次元の図については立体感を出してください。 ※ 左右の図を関連付ける線と丸は、ペイント・ソフトを使用して追記しています。 **生成AIで出来ることと出来ないこと [#h81cf3ea] ***出来ること [#wb5dbf37] そもそもナレッジ生成は(ナレッジのリサーチとは)ドメインに適合した(既知の)情報のセットを取得すること。 -ドメイン知識がある場合のナレッジ生成(ナレッジのリサーチ)~ ドメインに適合した(既知の)情報のセットを取得するためのプロンプトを与える。 --既知問題~ コーパスで学習しているハズなので、ソレを取り出すプロンプトを与える。 --未知問題~ コーパスで学習していないので、情報を組み合わせたり、傾向を探ったりするプロンプトを与える。 ---ドメイン知識の補完・拡張 ---探索的質問(未知の問題を洗い出す発見的手法) ---先行研究の穴(空白や未着手領域)分析 ---異分野のアイディアの組合せ ---批判的検討の補助(反証やリスク分析) ---プロトタイプ的調査・検証 ---例えば「未来予測」は上記の組合せからなる~ ・傾向から誘導:質問 → 回答 → 回答の傾向を踏まえた質問 → 回答~ ・分岐シナリオ生成、兆しの抽出、アブダクション的推論、ナラティブ的構成 -ドメイン知識のない場合~ ドメインに適合した(既知の)情報のセットを取得するための適切なプロンプトを与えるのが難しい。 --情報収集レベルのナレッジ生成(ナレッジのリサーチ)は可能 --それ以上のナレッジ生成(ナレッジのリサーチ)は[[出来ないこと>#fbce5286]]を参照。 --特に専門外とのコラボレーションによって価値が生まれるケースに期待 ***出来ないこと [#fbce5286] -「情報の網羅性の欠如」と「フォーカスポイントの欠如」 --「平均的な知識」や「よく知られたトピック」に偏る --膨大な文書から学習しているため、形式化された構造(テンプレ的構造)には強い。 --内容の意味的な重みや本質的な論点を見極める力は人間ほど強くない。 --従って、重要な視点や最新の情報の項目が抜け落ちる可能性がある。 --また、重要なハイレベル課題にリーチしない(プロンプトで誘導できない)。 -...AIを使用し「零」ベースでドメイン知識を得るのは非効率。 *詳細 [#kaa4fbbf] **ドメイン・ナレッジ生成ステップ [#gd7fab87] ***1. 一般知識から基礎ドメイン知識への変換 [#m35e4e9c] -用語の適合 -概念の再構築:ドメイン文脈で一般知識を解釈し直す -事例の選定:実例を使い一般知識をカスタマイズ ***2. 重み付けと情報の比率調整 [#kec5dc5c] より高度な専門知識に適応させる。 -関連度に応じた重み付け -コンテキスト取得元データソースの選択 -ICLによる専門性の向上 ※ ココでは主に「[["体系的"ドメイン・コンテキスト>#ae6900ac]]」を使用する。 ※ ココでの「体系的と」は目的に適合するように「階層化されたMECEな(インデックス)情報」に近い。 ***3. ドメイン独自ルール(定義)を適用 [#b2ce2b05] -論理ルール(当該ドメインにおける原則)の適用 -ドメイン用語集や独自フレームワークの導入 -ドメイン強制ルールの適用 ***4. 最適化とフィードバックループ [#y757c2c6] -人間による評価(RLHF) -プロンプトエンジニアリング -(ファインチューニング) **体系的ドメイン・コンテキストの作成方法 [#ae6900ac] [[リバース>#i1f0ad91]]、[[フォワード>#y0923734]]の手法があり、基本的にはフォワードで事足りる。~ フォワードでは、必要な情報が含まれなかったり、情報の比率が異なる様なケースで、リバース手法で補う事が出来る。 ***フォワード [#y0923734] -体系的ドメイン・コンテキストのフォワード自動生成 AAAAにおけるBBBBについての重要な項目を2-3層の目次レベルで体系化してください。 -CCCCにフォーカスして詳細化 CCCCにフォーカスしてさらに詳細化して下さい。 -DDDD界隈のドメインに特化させる 更に界隈の常識に特化させ、且つ、以下のトピックを追加して下さい。 - ...上段で不足していたトピックのリストを渡す... ***リバース [#i1f0ad91] -ソースを体系的ドメイン・コンテキストを生成するためのノウハウとして使用する。 -リバースでの体系的ドメイン・コンテキストは手動(従来通り)と自動(生成AIを活用)によるものがある。 --手動作成:従来通り(例:[[性能問題のポイント>https://techinfoofmicrosofttech.osscons.jp/index.php?%E6%80%A7%E8%83%BD%E5%95%8F%E9%A1%8C%E3%81%AE%E3%83%9D%E3%82%A4%E3%83%B3%E3%83%88]]) --自動生成:リーフページから生成 ---プロンプトの例 「以下はノウハウ集のリーフページのXXXXを要約したものです。 ココから、このドメインのXXXXに関する重要項目を2-3層の目次レベルで体系化するとどのようになりますか?」 ---ただし、生成AIは、以下の点で問題があると言われているので、複雑な体系化は難しい可能性がある。 ・与えられた情報を文章として整えることは得意だが、知識の構造を認識し、階層的に整理することは苦手。 ・大量のリーフページ情報を一度に扱うことができないため階層的な全体像を保持しつつ要約するのが困難。 ・一貫した論理構造を維持するのが苦手なため、同じドメインでも質問の仕方次第で異なる解釈をすることがある。 ・(一応、この文脈で、グラフ技術が活用できる旨があったが、グラフの評価結果からはあまり期待していない) ---また、リーフページから抽出した情報が適切でない場合、誤った体系的ドメイン・コンテキストが出力される。 ・検索されたチャンクが質問の意図とズレていた場合、言語モデルはその情報に引きずられて、誤った/関係ない回答を生成する。 ・取得されたチャンクが古い情報や誤った記述だった場合、それが信頼できる情報として生成結果に反映される。 ・関連度が低い情報(ノイズ)が多数混入すると、本当に重要な文脈が埋もれてしまい、回答の質が低下する。 *参考 [#h7100b45] **OSSコンソーシアム [#ie4b551e] ***学びをサポートするAI活用のAS-ISとTO-BE [#f9559575] https://1drv.ms/p/s!Amfs5caPP9r5kAxog0vFyvOF_zsi ***リサーチをサポートするAI活用のAS-ISとTO-BE [#l1547cca] https://1drv.ms/p/s!Amfs5caPP9r5kB29-FBGDhVDl0RR **Xナレッジ生成用プロンプト [#d0a53ec2] ***[[性能に関するナレッジ生成用プロンプト]] [#sabc4f84] ***[[移行に関するナレッジ生成用プロンプト]] [#kb86d52f] ***[[PMに関するナレッジ生成用プロンプト]] [#sb081826] IP:155.190.48.48 TIME:"2025-04-14 (月) 15:53:29" REFERER:"https://opentouryo.osscons.jp/index.php?cmd=edit&page=%E3%83%8A%E3%83%AC%E3%83%83%E3%82%B8%E7%94%9F%E6%88%90%E7%94%A8%E3%83%97%E3%83%AD%E3%83%B3%E3%83%97%E3%83%88" USER_AGENT:"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36"