


実行スクリプト
PS C:\Users\mars> docker run -d -p 3000:8080 –e RAG_EMBEDDING_ENGINE=ollama -e RAG_EMBEDDING_MODEL=bge-m3:latest –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui-rag –restart always ghcr.io/open-webui/open-webui:main
PS C:\Users\mars>docker run -d -p 3000:8080 -e RAG_EMBEDDING_ENGINE=ollama -e RAG_EMBEDDING_MODEL=bge-m3:latest –gpus all –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:cuda
埋め込みモデル設定
セマンティックベクトルエンジン: Ollama
モデル名: bge-m3:latest
チャンクサイズ: 1500
チャンクオーバーラップ: 100
openwab-uiの画面のchat controlパラメータで、設定をdefaultから変更した方が良い項目と内容を教えて
以下は、一般的なユースケースにおける例です:
ユースケース | Max Tokens | Temperature | Top-p | Repetition Penalty |
---|---|---|---|---|
短い正確な回答 | 100 | 0.5 | 0.8 | 1.2 |
長文で詳細な説明 | 300 | 0.7 | 0.9 | 1.1 |
創造的・自由な文章生成 | 500 | 1.0 | 1.0 | 1.0 |
Grokに問い合わせた結果
Open WebUIのRAG機能を利用する場合、重要なパラメータなどの要素と、その設定値は?
Open WebUIでRAG(Retrieval-Augmented Generation)機能を利用する際、効果的な動作を実現するためには、いくつかの重要なパラメータや設定要素を適切に調整する必要があります。以下に、主要な要素とその設定値について説明します。これらはOpen WebUIの管理者パネル(例: 「設定 > ドキュメント」や「ワークスペース > モデル」)で調整可能な項目に基づいています。
nomic-embed-text
(137Mパラメータ)やmxbai-embed-large
(334Mパラメータ)など、より大きなモデルを選択。bge-m3
(多言語対応で高性能)。cross-encoder/ms-marco-MiniLM-L-6-v2
(高速だが精度は中程度)。cross-encoder/ms-marco-MiniLM-L-12-v2
(より正確だが処理負荷が増加)。gemma2:2b
(軽量)、ELYZA-japanese-Llama-2-13b
(日本語対応)。gpt-4o-mini
(高精度だがコストがかかる)。bge-m3
に変更。cross-encoder/ms-marco-MiniLM-L-12-v2
を指定。gemma2:2b
)を選択し、RAG用にカスタムモデルを作成。これらのパラメータを適切に設定することで、Open WebUIのRAG機能を最大限に活用し、高精度で有用な回答を得られる環境を構築できます。
100K文字程度のテキストをRAGで検索すると仮定した際に、それぞれのパラメータの最適値は?
100K文字程度のテキストをRAG(Retrieval-Augmented Generation)で検索する場合、データ量としては中規模(日本語で約50K〜100Kトークン程度と仮定)に該当します。この規模のテキストを効率的かつ高精度に処理するためには、パラメータの設定に以下の点を考慮する必要があります。以下に、前回の回答をベースに具体的な最適値を提案します。
bge-m3
bge-m3
は約568Mパラメータを持ち、日本語を含む多言語で優れた性能を発揮。all-MiniLM-L12-v2
(軽量かつそこそこの精度)。cross-encoder/ms-marco-MiniLM-L-12-v2
L-12-v2
は精度と速度のバランスが良く、100K文字程度の処理に適している。MiniLM-L-6-v2
。---
)を挿入。gemma2:9b
(9Bパラメータで高精度かつ中規模データに適応)。gpt-4o-mini
(コスト効率と性能のバランス)。gemma2:9b
はローカルで実行可能な高性能モデル、gpt-4o-mini
はAPI利用時の最適解。bge-m3
cross-encoder/ms-marco-MiniLM-L-12-v2
gemma2:9b
(ローカル)またはgpt-4o-mini
(クラウド)L-12-v2
→ Electra
)。この設定なら、100K文字程度のテキストをRAGで効率的に検索し、高精度な回答を生成できるはずです。実際のデータやハードウェアに応じて微調整してください。
1987年に見学したことがあります。当時は、軍からの申し込みや各州の有力者等を介して団体で見学するツアーがあったようで、米空軍を通じてその中に加えてもらった。この動画によると、2006年にピーターソン宇宙軍基地へ移転し、2015年に電磁パルス攻撃に対しても有効なこの基地を復活させたとのこと。
出典 https://www.youtube.com/watch?v=RJg1iPwnaQg&t=4s&ab_channel=USAMilitaryChannel2
Googleのgeminiで内容を要約してみました。
このビデオは、シャイアンマウンテン宇宙軍基地と呼ばれる、コロラド州のロッキー山脈の地下にある巨大な地下要塞についてです。
この要塞は、冷戦時代に北米航空宇宙防衛司令部(NORAD)の司令部として使用するために建設されました。NORADは、人工衛星、核ミサイル、弾道ミサイル、戦略爆撃機の動きを24時間体制で監視するために、1957年にアメリカとカナダによって設立された組織です。
シャイアンマウンテン宇宙軍基地は、1961年から1967年にかけて建設され、総費用は1億4240万ドルでした。花崗岩の山の下に建設され、30メガトンの核爆発にも耐えられるように設計されています。
基地内には15棟の建物があり、最大600万ガロンの水を貯蔵できる4つの貯水槽と、容量50万ガロンのディーゼル燃料貯蔵タンクがあります。また、核シェルターとしても機能し、食堂、売店、医療施設、フィットネスルームなど、生活に必要な設備がすべて揃っています。さらに、化学兵器、生物兵器、放射線などの汚染物質を除去するための換気フィルターも備えています。これらの設備により、核戦争後も最大800人が生き残ることが可能だと言われています。
冷戦が終結し、核の脅威が減少したため、NORADの司令部は2006年にピーターソン宇宙軍基地に移転しました。しかし、電磁パルス攻撃に対しても有効なこの基地を活用しようと、2015年にアメリカ国防総省は7億ドルをかけて基地を回収し、再稼働させました。
現在、シャイアンマウンテン宇宙軍基地は、有事の際に地下司令部として、また訓練施設として機能しています。
USAF Considering Reuse of Previous Backscatter Sites
米国メイン州のOTH-Bサイト。1987年に訪問。このサイト専用の発電所もあったと記憶している。
The U.S. Air Force said that it is considering reuse of the previous Over the Horizon Backscatter (OTH-B) radar sites to augment the U.S.-Canadian North Warning System (NWS).
In fiscal 2024 the Air Force requests more than $423 million for rapid prototyping of OTH-B to supplement NWS, including funds to satisfy a classified U.S. European Command requirement, $360 million to fund the first two OTH-B sites in the U.S., and funds for the detection of stratospheric balloons and unidentified aerial phenomena.
2016年9月
BlackHat2016のarsenal部門に採択されてraspberry piとhackRFで構成したRF信号発生器WALB:Wireless Attack Launch Boxを発表
NCG2238 バラ星雲 M31 アンドロメダ銀河