「Open棟梁 wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
生成AIを使用してドメイン・ナレッジを生成したい。
AIに質問した所、以下のような回答があった。
以下のようなものがある。
基本的な専門知識は生成AIが保有しているから...
情報の比率や重みを「ドメイン・コンテキスト」「ドメイン独自ルール」で調整してドメインに特化させる。
※ ドメイン・コンテキストと言う造語は「生成AIが保有している一般知識をドメインに特化させるためのコンテキスト」の意
一般的な情報に「XXX(ドメイン)においては?」と言う軸を加え「追加軸での分布(比率、重み、条件)が追加された」情報を取得する。
結構、良い絵が出たのでプロンプトをメモ
以下のような言語モデル生成AIの画像イメージを生成してください。 ・情報が空間(2次元散布図)上に散らばっているものとします。 ・プロンプトで2次元の集合から情報を抽出します。 ・プロンプトを追加する事で2次元の集合に次元を追加し3次元の集合から情報を抽出します。 ・集合からの情報抽出イメージは1つのプロットではなく複数のプロットを含む集合をポイントします。 ・3次元の図については立体感を出してください。
※ 左右の図を関連付ける線と丸は、ペイント・ソフトを使用して追記しています。
そもそもナレッジ生成はドメインに適合したナレッジ情報のセットを取得すること。
生成AIがドメイン知識を学習済みの場合のナレッジ生成(ナレッジのリサーチ)
ドメインに適合した(既知の)情報のセットを取得するためのプロンプトを与える。
網羅性や重要度を目的変数として最適化していないため
「情報の網羅性の欠如」と「フォーカスポイントの欠如」が発生する。
...従って、AIを使用し「0(零)」ベースでドメイン知識を得るのは非効率。
リバース、フォワードの手法があり、基本的にはフォワードで事足りる。
フォワードでは、必要な情報が含まれなかったり、情報の比率が異なる様なケースで、リバース手法で補う事が出来る。
AAAAにおけるBBBBについての重要な項目を2-3層の目次レベルで体系化してください。
CCCCにフォーカスしてさらに詳細化して下さい。
更に界隈の常識に特化させ、且つ、以下のトピックを追加して下さい。 - ...上段で不足していたトピックのリストを渡す...
「以下はノウハウ集のリーフページのXXXXを要約したものです。 ココから、このドメインのXXXXに関する重要項目を2-3層の目次レベルで体系化するとどのようになりますか?」
・与えられた情報を文章として整えることは得意だが、知識の構造を認識し、階層的に整理することは苦手。 ・大量のリーフページ情報を一度に扱うことができないため階層的な全体像を保持しつつ要約するのが困難。 ・一貫した論理構造を維持するのが苦手なため、同じドメインでも質問の仕方次第で異なる解釈をすることがある。 ・(一応、この文脈で、グラフ技術が活用できる旨があったが、グラフの評価結果からはあまり期待していない)
・検索されたチャンクが質問の意図とズレていた場合、言語モデルはその情報に引きずられて、誤った/関係ない回答を生成する。 ・取得されたチャンクが古い情報や誤った記述だった場合、それが信頼できる情報として生成結果に反映される。 ・関連度が低い情報(ノイズ)が多数混入すると、本当に重要な文脈が埋もれてしまい、回答の質が低下する。
あなたはユーザーの要求に合わせインターネット検索を行い、発見した技術情報を提供するエージェントです。
インターネットや、インターネット上の以下の優先ナレッジから情報を取得して回答をします。
https://opentouryo.osscons.jp/
https://techinfoofmicrosofttech.osscons.jp/
https://dotnetdevelopmentinfrastructure.osscons.jp/
優先ナレッジを使用する場合、以下の様に検索してください。
site:techinfoofmicrosofttech.osscons.jp {キーワード}
参考にしたWebページ情報はユーザにも提示して下さい。
ユーザーの要求: 「XXXXのYYYYを教えてください。」 ※ キーワードには「X」「Y」「Z」などを使用します。
エージェントを使うとブラックボックス化できる。
より高度な専門知識に適応させる。
※ ココでは主に「"体系的"ドメイン・コンテキスト」を使用する。
※ ココでの「体系的と」は目的に適合するように「階層化されたMECEな(インデックス)情報」に近い。
...