ナレッジ生成用プロンプト
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
「[[Open棟梁 wiki>https://opentouryo.osscons.jp]]」は、「...
-[[戻る>FrontPage]]
--[[設計のポイント]]
--[[PMのポイント]]
--ナレッジ生成用プロンプト
---[[性能に関するナレッジ生成用プロンプト]]
---[[移行に関するナレッジ生成用プロンプト]]
---[[PMに関するナレッジ生成用プロンプト]]
*目次 [#h8399e37]
#contents
*概要 [#e32a91c8]
生成AIを使用してドメイン・ナレッジを生成したい。
-ドメイン・ナレッジには[[「完全な暗黙知」と「擬似的な暗黙...
-後者については、生成AIでも、かなりの部分が生成できる。
-元々、Wikiからドメイン・ナレッジを生成しようとしていた(...
-しかし、[[基本的な専門知識は生成AIが保有している>#r9f042...
**暗黙知に付いての定義 [#qb34792a]
ドメイン・ナレッジの前に、暗黙知に付いての定義をしておく。
***AIの回答 [#ke2ed307]
AIに質問した所、以下のような回答があった。
-LLMは大量の文章からパターンを学んでいるから、専門書で文...
-しかし、身体感覚に強く依存するもの、非常に狭い界隈に限定...
***擬似的な暗黙知 [#k5652b74]
-AI(言語モデル)自体が暗黙知を説明できるのはコーパスから...
--「完全な暗黙知」は本質的に形式知化が不可能な部分もある...
--「擬似的な暗黙知」は単一のナレッジ・ベースにまとまって...
---言語化し難いという側面に加えデータ化されていないと言う...
---「職人の勘」のようなものも、データ化することで人間以上...
-しかし、「擬似的な暗黙知」も、コスパ観点やモチベーション...
--コスパ観点:形式知化がコスパ的に合わない。
--モチベーション観点:形式知化がデメリットになるなどで動...
***状況を決める因子 [#q419486d]
以下のようなものがある。
-非言語的:感覚や身体動作など言語では捉え難く、また、デー...
-組織文化:経験を形式知として残すことの価値の認識がない場合
-認知の壁:そもそも自分のやってることは価値があるとの認識...
-状況依存性:文脈依存での場合が分けが多く、一般化・共有・...
**ドメイン・ナレッジの生成 [#r9f042ad]
基本的な専門知識は生成AIが保有しているから...
***仮説:フォワード生成できるのでは? [#nf56ffd8]
情報の比率や重みを「[[ドメイン・コンテキスト>#ae6900ac]]...
-AIが保有していない知識は、「組織内の独自情報」(ルールな...
-この[[ドメイン・コンテキスト>#ae6900ac]]で「細分化された...
>※ [[ドメイン・コンテキスト>#ae6900ac]]と言う造語は「生成...
-必要に応じ、ドメイン独自のルール(定義)を加え、完全に[[...
***ドメインに適合させるイメージ [#kcc6ed6e]
一般的な情報に「XXX(ドメイン)においては?」と言う軸を加...
|#ref(ChatGPT_Image_20250409_1.gif,left,nowrap,集合,30%)|...
|CENTER:イメージA|CENTER:イメージB|
|>|CENTER:イメージA、イメージBとあるが、意味するところは...
結構、良い絵が出たのでプロンプトをメモ
以下のような言語モデル生成AIの画像イメージを生成してくだ...
・情報が空間(2次元散布図)上に散らばっているものとしま...
・プロンプトで2次元の集合から情報を抽出します。
・プロンプトを追加する事で2次元の集合に次元を追加し3次元...
・集合からの情報抽出イメージは1つのプロットではなく複数...
・3次元の図については立体感を出してください。
※ 左右の図を関連付ける線と丸は、ペイント・ソフトを使用し...
**生成AIを用いたナレッジ生成で出来ることと出来ないこと [#...
そもそもナレッジ生成はドメインに適合したナレッジ情報のセ...
***出来ること [#wb5dbf37]
生成AIがドメイン知識を学習済みの場合のナレッジ生成(ナレ...
ドメインに適合した(既知の)情報のセットを取得するための...
-既知問題(かんたん)~
コーパスで学習しているハズなので、ソレを取り出すプロンプ...
-未知問題(ただし難しい)~
コーパスで学習していないので、情報を組み合わせたり、傾向...
「確定的な知識獲得」ではなく、類似ドメイン・隣接領域から...
***出来ないこと [#fbce5286]
膨大なコーパスで学習しているが、網羅性や重要度を目的変数...
網羅性が無い「情報の網羅性の欠如」と重要度がポイントされ...
-「平均的な知識」「多数派の言説」「よく知られたトピック」...
-膨大なコーパスで学習しているため、テンプレ的構造には強い...
目的依存で内容の意味的な重みや本質的な論点を再定義する力...
--重要な視点(低頻度重要問題)や最新の情報の項目(時間軸...
--重要なハイレベル課題に人間が適切な軸をプロンプトとして...
...従って、AIを使用し「0(零)」ベースでドメイン知識を得...
*詳細 [#kaa4fbbf]
**体系的ドメイン・コンテキストの作成方法 [#ae6900ac]
[[フォワード生成>#y0923734]]、[[リバース生成>#i1f0ad91]]...
フォワード生成で、必要な情報(網羅性、比率、重み、条件)...
***フォワード生成 [#y0923734]
-体系的ドメイン・コンテキストのフォワード自動生成
AAAAにおけるBBBBについての重要な項目を2-3層の目次レベル...
--CCCCにフォーカスして詳細化
CCCCにフォーカスしてさらに詳細化して下さい。
--DDDD界隈のドメインに特化させる
更に界隈の常識に特化させ、且つ、以下のトピックを追加して...
- ...上段で不足していたトピックのリストを渡す...
-最近は、上記の手順を踏まずに提案されるようになってきた(...
--入力:IT系の性能問題で発生しやすい問題はどの様な問題で...
--出力:...Web系/業務系/クラウド/組込、設計・実装か?運用...
--入力:(例)業務系
--出力:...新規開発/既存改善、オンライン/バッチ、DB種別
--入力:(例)新規・オンライン
***リバース生成 [#i1f0ad91]
-ソースを体系的ドメイン・コンテキストを生成するためのノウ...
-リバースでの体系的ドメイン・コンテキストは「既存」と「生...
--既存:例えば「[[性能問題のポイント>https://techinfoofmi...
--生成:VDBに格納したリーフページから生成
---プロンプトの例
「以下はノウハウ集のリーフページのXXXXを要約したものです。
ココから、このドメインのXXXXに関する重要項目を2-3層の目...
---ただし、生成AIは、以下の点で問題があると言われているの...
・与えられた情報を文章として整えることは得意だが、知識の...
・大量のリーフページ情報を一度に扱うことができないため階...
・一貫した論理構造を維持するのが苦手なため、同じドメイン...
・(一応、この文脈で、グラフ技術が活用できる旨があったが...
---また、取得したチャンクが適切でない場合、誤った体系的ド...
・検索されたチャンクが質問の意図とズレていた場合、言語モ...
・取得されたチャンクが古い情報や誤った記述だった場合、そ...
・関連度が低い情報(ノイズ)が多数混入すると、本当に重要...
--生成:エージェントのGoogle検索結果から生成
---プロンプトの例
あなたはユーザーの要求に合わせインターネット検索を行い、...
インターネットや、インターネット上の以下の優先ナレッジか...
https://opentouryo.osscons.jp/
https://techinfoofmicrosofttech.osscons.jp/
https://dotnetdevelopmentinfrastructure.osscons.jp/
優先ナレッジを使用する場合、以下の様に検索してください。
site:techinfoofmicrosofttech.osscons.jp {キーワード}
参考にしたWebページ情報はユーザにも提示して下さい。
ユーザーの要求:
「XXXXのYYYYを教えてください。」
※ キーワードには「X」「Y」「Z」などを使用します。
---GoogleはVBDと異なり、Recallは捨てて、 Precisionを極限...
---XXXXのYYYYについて検索キーワードで検索した結果から重要...
**ドメイン・ナレッジ生成ステップ [#gd7fab87]
エージェントを使うとブラックボックス化できる。
***1. 一般知識から基礎ドメイン知識への変換 [#m35e4e9c]
-用語の適合
-概念の再構築:ドメイン文脈で一般知識を解釈し直す
-事例の選定:実例を使い一般知識をカスタマイズ
***2. 重み付けと情報の比率調整 [#kec5dc5c]
より高度な専門知識に適応させる。
-関連度に応じた重み付け
-コンテキスト取得元データソースの選択
-ICLによる専門性の向上
※ ココでは主に「[["体系的"ドメイン・コンテキスト>#ae6900a...
※ ココでの「体系的と」は目的に適合するように「階層化され...
***3. ドメイン独自ルール(定義)を適用 [#b2ce2b05]
-論理ルール(当該ドメインにおける原則)の適用
-ドメイン用語集や独自フレームワークの導入
-ドメイン強制ルールの適用
***4. 最適化とフィードバックループ [#y757c2c6]
-人間による評価(RLHF)
-プロンプトエンジニアリング
-(ファインチューニング)
*参考 [#h7100b45]
...
終了行:
「[[Open棟梁 wiki>https://opentouryo.osscons.jp]]」は、「...
-[[戻る>FrontPage]]
--[[設計のポイント]]
--[[PMのポイント]]
--ナレッジ生成用プロンプト
---[[性能に関するナレッジ生成用プロンプト]]
---[[移行に関するナレッジ生成用プロンプト]]
---[[PMに関するナレッジ生成用プロンプト]]
*目次 [#h8399e37]
#contents
*概要 [#e32a91c8]
生成AIを使用してドメイン・ナレッジを生成したい。
-ドメイン・ナレッジには[[「完全な暗黙知」と「擬似的な暗黙...
-後者については、生成AIでも、かなりの部分が生成できる。
-元々、Wikiからドメイン・ナレッジを生成しようとしていた(...
-しかし、[[基本的な専門知識は生成AIが保有している>#r9f042...
**暗黙知に付いての定義 [#qb34792a]
ドメイン・ナレッジの前に、暗黙知に付いての定義をしておく。
***AIの回答 [#ke2ed307]
AIに質問した所、以下のような回答があった。
-LLMは大量の文章からパターンを学んでいるから、専門書で文...
-しかし、身体感覚に強く依存するもの、非常に狭い界隈に限定...
***擬似的な暗黙知 [#k5652b74]
-AI(言語モデル)自体が暗黙知を説明できるのはコーパスから...
--「完全な暗黙知」は本質的に形式知化が不可能な部分もある...
--「擬似的な暗黙知」は単一のナレッジ・ベースにまとまって...
---言語化し難いという側面に加えデータ化されていないと言う...
---「職人の勘」のようなものも、データ化することで人間以上...
-しかし、「擬似的な暗黙知」も、コスパ観点やモチベーション...
--コスパ観点:形式知化がコスパ的に合わない。
--モチベーション観点:形式知化がデメリットになるなどで動...
***状況を決める因子 [#q419486d]
以下のようなものがある。
-非言語的:感覚や身体動作など言語では捉え難く、また、デー...
-組織文化:経験を形式知として残すことの価値の認識がない場合
-認知の壁:そもそも自分のやってることは価値があるとの認識...
-状況依存性:文脈依存での場合が分けが多く、一般化・共有・...
**ドメイン・ナレッジの生成 [#r9f042ad]
基本的な専門知識は生成AIが保有しているから...
***仮説:フォワード生成できるのでは? [#nf56ffd8]
情報の比率や重みを「[[ドメイン・コンテキスト>#ae6900ac]]...
-AIが保有していない知識は、「組織内の独自情報」(ルールな...
-この[[ドメイン・コンテキスト>#ae6900ac]]で「細分化された...
>※ [[ドメイン・コンテキスト>#ae6900ac]]と言う造語は「生成...
-必要に応じ、ドメイン独自のルール(定義)を加え、完全に[[...
***ドメインに適合させるイメージ [#kcc6ed6e]
一般的な情報に「XXX(ドメイン)においては?」と言う軸を加...
|#ref(ChatGPT_Image_20250409_1.gif,left,nowrap,集合,30%)|...
|CENTER:イメージA|CENTER:イメージB|
|>|CENTER:イメージA、イメージBとあるが、意味するところは...
結構、良い絵が出たのでプロンプトをメモ
以下のような言語モデル生成AIの画像イメージを生成してくだ...
・情報が空間(2次元散布図)上に散らばっているものとしま...
・プロンプトで2次元の集合から情報を抽出します。
・プロンプトを追加する事で2次元の集合に次元を追加し3次元...
・集合からの情報抽出イメージは1つのプロットではなく複数...
・3次元の図については立体感を出してください。
※ 左右の図を関連付ける線と丸は、ペイント・ソフトを使用し...
**生成AIを用いたナレッジ生成で出来ることと出来ないこと [#...
そもそもナレッジ生成はドメインに適合したナレッジ情報のセ...
***出来ること [#wb5dbf37]
生成AIがドメイン知識を学習済みの場合のナレッジ生成(ナレ...
ドメインに適合した(既知の)情報のセットを取得するための...
-既知問題(かんたん)~
コーパスで学習しているハズなので、ソレを取り出すプロンプ...
-未知問題(ただし難しい)~
コーパスで学習していないので、情報を組み合わせたり、傾向...
「確定的な知識獲得」ではなく、類似ドメイン・隣接領域から...
***出来ないこと [#fbce5286]
膨大なコーパスで学習しているが、網羅性や重要度を目的変数...
網羅性が無い「情報の網羅性の欠如」と重要度がポイントされ...
-「平均的な知識」「多数派の言説」「よく知られたトピック」...
-膨大なコーパスで学習しているため、テンプレ的構造には強い...
目的依存で内容の意味的な重みや本質的な論点を再定義する力...
--重要な視点(低頻度重要問題)や最新の情報の項目(時間軸...
--重要なハイレベル課題に人間が適切な軸をプロンプトとして...
...従って、AIを使用し「0(零)」ベースでドメイン知識を得...
*詳細 [#kaa4fbbf]
**体系的ドメイン・コンテキストの作成方法 [#ae6900ac]
[[フォワード生成>#y0923734]]、[[リバース生成>#i1f0ad91]]...
フォワード生成で、必要な情報(網羅性、比率、重み、条件)...
***フォワード生成 [#y0923734]
-体系的ドメイン・コンテキストのフォワード自動生成
AAAAにおけるBBBBについての重要な項目を2-3層の目次レベル...
--CCCCにフォーカスして詳細化
CCCCにフォーカスしてさらに詳細化して下さい。
--DDDD界隈のドメインに特化させる
更に界隈の常識に特化させ、且つ、以下のトピックを追加して...
- ...上段で不足していたトピックのリストを渡す...
-最近は、上記の手順を踏まずに提案されるようになってきた(...
--入力:IT系の性能問題で発生しやすい問題はどの様な問題で...
--出力:...Web系/業務系/クラウド/組込、設計・実装か?運用...
--入力:(例)業務系
--出力:...新規開発/既存改善、オンライン/バッチ、DB種別
--入力:(例)新規・オンライン
***リバース生成 [#i1f0ad91]
-ソースを体系的ドメイン・コンテキストを生成するためのノウ...
-リバースでの体系的ドメイン・コンテキストは「既存」と「生...
--既存:例えば「[[性能問題のポイント>https://techinfoofmi...
--生成:VDBに格納したリーフページから生成
---プロンプトの例
「以下はノウハウ集のリーフページのXXXXを要約したものです。
ココから、このドメインのXXXXに関する重要項目を2-3層の目...
---ただし、生成AIは、以下の点で問題があると言われているの...
・与えられた情報を文章として整えることは得意だが、知識の...
・大量のリーフページ情報を一度に扱うことができないため階...
・一貫した論理構造を維持するのが苦手なため、同じドメイン...
・(一応、この文脈で、グラフ技術が活用できる旨があったが...
---また、取得したチャンクが適切でない場合、誤った体系的ド...
・検索されたチャンクが質問の意図とズレていた場合、言語モ...
・取得されたチャンクが古い情報や誤った記述だった場合、そ...
・関連度が低い情報(ノイズ)が多数混入すると、本当に重要...
--生成:エージェントのGoogle検索結果から生成
---プロンプトの例
あなたはユーザーの要求に合わせインターネット検索を行い、...
インターネットや、インターネット上の以下の優先ナレッジか...
https://opentouryo.osscons.jp/
https://techinfoofmicrosofttech.osscons.jp/
https://dotnetdevelopmentinfrastructure.osscons.jp/
優先ナレッジを使用する場合、以下の様に検索してください。
site:techinfoofmicrosofttech.osscons.jp {キーワード}
参考にしたWebページ情報はユーザにも提示して下さい。
ユーザーの要求:
「XXXXのYYYYを教えてください。」
※ キーワードには「X」「Y」「Z」などを使用します。
---GoogleはVBDと異なり、Recallは捨てて、 Precisionを極限...
---XXXXのYYYYについて検索キーワードで検索した結果から重要...
**ドメイン・ナレッジ生成ステップ [#gd7fab87]
エージェントを使うとブラックボックス化できる。
***1. 一般知識から基礎ドメイン知識への変換 [#m35e4e9c]
-用語の適合
-概念の再構築:ドメイン文脈で一般知識を解釈し直す
-事例の選定:実例を使い一般知識をカスタマイズ
***2. 重み付けと情報の比率調整 [#kec5dc5c]
より高度な専門知識に適応させる。
-関連度に応じた重み付け
-コンテキスト取得元データソースの選択
-ICLによる専門性の向上
※ ココでは主に「[["体系的"ドメイン・コンテキスト>#ae6900a...
※ ココでの「体系的と」は目的に適合するように「階層化され...
***3. ドメイン独自ルール(定義)を適用 [#b2ce2b05]
-論理ルール(当該ドメインにおける原則)の適用
-ドメイン用語集や独自フレームワークの導入
-ドメイン強制ルールの適用
***4. 最適化とフィードバックループ [#y757c2c6]
-人間による評価(RLHF)
-プロンプトエンジニアリング
-(ファインチューニング)
*参考 [#h7100b45]
...
ページ名: