Hermes DesktopとLM Studioを接続する方法|Base URL・Model ID・Local Server確認
- 公開日
- 2026-06-07
- 更新日
- 2026-06-26
- 情報確認日
- 2026-06-26
Hermes DesktopをLM Studioにつなぐ時は、LM Studioでモデルを動かす、Local Serverを起動する、Base URLとModel IDをHermes側へ合わせる、という順番で確認します。この記事は通常手順の担当です。つながらない時の詳細原因はトラブルシュート記事へ分けます。
導入前に確認すること
- Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
- 最初は軽量モデル、短い質問、少ない同時作業から始める
- 公式サイトの対応OS、利用規約、モデルのライセンスを確認する
小型LLMをHermesへつなぐ前に
Hermes Desktopへつなぐ前に、LM Studio単体で軽いQ4/Q5モデルが短い日本語質問に安定して答えるか確認します。接続問題とモデル負荷を混ぜないことが大切です。
- 小型LLMエージェント利用条件 - Hermesとlocal providerの役割を確認する
- Hermes接続トラブル診断 - つながらない時に原因を絞る
Hermes Desktopでつながらない時の読み順
Hermes Desktopの設定を何度も変える前に、症状別ハブで provider 側、base URL、model ID、API key、PC負荷を分けて確認してください。
- Hermes Desktopトラブル解決ハブ - connection refused、model not found、401/429、timeout、WSL2を症状別に切り分ける
- Hermes Desktop接続トラブル診断 - 数問選んで最初に疑う原因と読む記事を確認する
LLM Studioと検索して来た人へ
この記事では、ローカルLLMアプリの公式名称である「LM Studio」と、検索で見かける「LLM Studio」という表記揺れをまとめて扱います。設定で確認する名前は、LM Studio公式画面・Hermes側のprovider名・実際のModel IDを優先してください。
まず結論:Hermes DesktopとLM Studioは役割が違う
接続の流れは「ユーザー → Hermes Desktop → Hermes Agent → LM Studio Local Server → 読み込み済みGGUFモデル」です。Hermes DesktopがGGUFを直接読むのではなく、LM Studioが読み込んだモデルへHermes Agentが話しかける、と分けて考えると設定が追いやすくなります。
モデル実行側と操作側を分けて、最短順で設定します。
代表例ではなく、起動中のServer画面に表示された値を優先します。
表示名やGGUFファイル名と同じとは限らない点を確認します。
Local Server、Base URL、Model IDの順で症状を切り分けます。
接続前に確認する3つ
- LM Studioを起動する。
- 使うGGUFモデルを選ぶ。
- LM Studio単体チャットで短い日本語質問に返答できるか確認する。
- Developer / Server系の画面でLocal Serverを起動する。
- 画面に出ているBase URLを確認する。例は http://localhost:1234/v1 ですが、必ず現在の画面を優先する。
- /v1/models またはLM Studioのモデル一覧で、Hermes側に入れるModel IDを確認する。
- Hermes Desktop / Hermes Agent側でLM Studio providerまたはOpenAI互換endpointを設定する。
- 短い質問で接続確認する。
- 重い・止まる場合は、GGUF/量子化/PC負荷の記事へ戻る。
- LM Studioにつながらない場合は、Base URL・Model ID・Local Serverの順に確認する - 症状別の確認表へ進む
- GGUFやQ4/Q5/Q8が分からない場合は、GGUFの見方を先に確認する - LM Studioで使うモデル形式と量子化を見る
設定例:LM StudioとHermes Desktopで同じ値を見る
| 項目 | LM Studio側で見る場所 | Hermes側で合わせるもの | 間違えやすい点 |
|---|---|---|---|
| Local Server | Developer / Server画面 | 接続先として利用 | チャットできてもServer未起動の場合がある |
| Base URL | Server画面に表示されたURL | base_url / endpoint | /v1 の有無、port違い |
| Model ID | APIのmodels一覧・ロード済みモデル | model欄 | 表示名やGGUFファイル名と一致しない場合がある |
| API key | 認証設定 | 必要な場合のみ | ローカルでは不要な構成もある |
| GGUFモデル | モデル管理画面 | 間接的に利用 | Hermes DesktopがGGUFを直接読むわけではない |
- LM Studioでモデルをロードし、LM Studio内のチャットで「1+1を一文で答えて」と質問します。
- DeveloperまたはServer画面でローカルサーバーを起動し、表示中のBase URLとPortを控えます。
- Hermes DesktopでProvider、Base URL、Model IDを同じ接続先に合わせます。
- 最初は「こんにちは。日本語で一文だけ返して」のような短い質問で接続だけを確認します。
- 接続後に長い指示やツール操作を試します。現在のHermes公式案内ではエージェント用途に大きなコンテキスト長を求める場合があるため、PC負荷も確認します。
LM Studioの標準的なローカルAPIはOpenAI互換形式を提供しますが、画面名・認証・既定ポートはバージョンや設定で変わることがあります。固定値を暗記せず、起動中のServer画面とHermesのモデル一覧を照合してください。
このメイン記事とトラブル記事の役割分担
このページは、初めて接続する人が通常手順を上から確認するためのページです。connection refused、model not found、timeout、401、429などの詳細なエラーは、トラブルシュート記事や症状別ハブへ進んでください。
| 読みたいこと | 担当ページ | 理由 |
|---|---|---|
| 通常の接続手順 | このページ | LM Studioでモデルを動かし、Local Server、Base URL、Model IDを合わせる |
| つながらない時の症状別確認 | /articles/hermes-desktop-lm-studio-troubleshooting/ | Local Server未起動、port違い、Model ID不一致、API key、重いモデルを切り分ける |
| connection refused / model not found | /articles/hermes-desktop-errors/ | 症状別ハブから詳細記事へ進む |
| モデルが重い・止まる | /articles/quantization-q4-q5-q8/ | 接続ではなくGGUF/量子化/PC負荷を疑う |
- Hermes接続診断ツール - 数問で最初に疑う原因を絞る
- Hermes Desktop症状別ハブ - エラー文から読む記事を選ぶ
- Hermes AgentとDesktopの違い - Agent本体とGUIの役割を確認する
LM StudioとOllamaで混ぜやすい接続項目
| 確認項目 | LM Studio | Ollama | Hermes側で見ること |
|---|---|---|---|
| モデルが動くか | 単体チャットで確認 | ollama runなどで確認 | まだ触らない |
| API server | Developer tabまたはlms server start | Ollama service / OpenAI互換endpoint | base URLを合わせる |
| base URL | 例: http://localhost:1234/v1 | 例: http://127.0.0.1:11434/v1 | provider設定へ入力 |
| model ID | /v1/modelsや画面表示で確認 | model名/tagを確認 | 指定名と一致させる |
| 遅い/無反応 | モデルサイズ・GPU offload | モデルサイズ・メモリ | timeoutと混同しない |
1234や11434は公式ドキュメントで出てくる代表例です。固定値として暗記せず、いま起動しているLM StudioまたはOllamaの画面・設定・ログを優先してください。
LM Studioで使うモデルを選ぶ
- GGUFやQ4/Q5/Q8が分からない場合は、GGUFの見方を先に確認する - モデルファイル形式を理解する
- Q4/Q5/Q8など量子化の違いを比較する - 軽さと品質のバランスを選ぶ
- LM Studioで最初に選ぶモデル - 7B/8B・Q4_K_Mから試す
- LM StudioのGPUオフロードを確認する - CPU 100%・GPU使用率が低い時の確認
PCスペックが厳しい場合は外部APIも候補
軽いGGUFへ下げても速度やメモリが足りない場合は、OpenRouterやDeepSeek APIなど外部APIへ処理を任せる選択肢があります。ただし、その会話はローカル完結ではなくなり、入力内容の外部送信と従量料金が発生する可能性があります。
- OpenRouterを使う方法 - 複数モデルとActivityの確認
- DeepSeek APIを使う方法 - 直接APIのmodel名とUsageを確認
- Providerの使い分け - ローカルと外部APIを用途で分ける
接続で詰まっている人へ
| 症状 | 最初に見ること | 詳しい記事 |
|---|---|---|
| connection refused | local server未起動・port違い | connection refused記事 |
| model not found | model ID不一致・モデル未ロード | model not found記事 |
| 返事が遅い・止まる | モデルサイズ・GPU offload・context | 遅い・止まる記事 |
- Hermes Desktopエラー別チェック - 症状から親ハブで選ぶ
- connection refusedを直す - serverとportを確認する
- model not foundを直す - model IDと /v1/models を確認する
最短手順:接続前に4か所をそろえる
- LM StudioでPCに合う軽いモデルをロードし、短い質問に回答できることを確認する。
- LM Studioのlocal serverを起動し、画面に表示されたbase URLとportを控える。
- Hermes Desktopのモデルプロバイダー設定で、対応する接続方式とbase URLを指定する。
- Hermes側のmodel IDをLM Studio側と一致させ、短い質問で接続を確認する。
URLや設定項目名はバージョンによって変わることがあります。固定値を暗記するより、LM Studioのサーバー画面に現在表示されている値を使う方が確実です。
LM Studio側とHermes側で見る場所
| 確認項目 | LM Studio側 | Hermes Desktop側 |
|---|---|---|
| モデル | ロード済みか、単体で回答するか | model IDが一致しているか |
| API | local serverが起動中か | 対応するproviderを選んだか |
| URL | 表示中のhostとport | base URLに同じ値を入れたか |
| エラー | server logやモデルロード失敗 | 接続エラーまたは認証エラー |
接続テストは軽い条件で行う
- 最初は7B/8B級の軽いInstructモデルと短い質問を使う。
- 長いシステムプロンプト、ツール実行、PDF参照は接続後に追加する。
- CPU 100%やメモリ逼迫がある場合は、接続ではなくモデル負荷の問題を疑う。
- localhostで失敗した場合は、実際のhost表示とアプリの実行環境を確認する。
- 接続できない時の症状別チェック - port・model ID・負荷を順に確認する
- LM StudioのGPUオフロード - 接続後の応答が遅い場合に確認する
冒頭の3行結論
- Hermes DesktopはLM Studioの代わりではありません。ローカルLLMを直接ロードする主役はLM Studio側です。
- LM Studioは、モデルを探す、落とす、読み込む、local serverとして提供するためのアプリです。
- Hermes Desktopは、Hermes AgentをGUIで扱いやすくし、LM Studioなどのモデルプロバイダーへつなぐ操作側です。
まず単体でチャットしたいだけなら、LM Studioだけで十分なことが多いです。Hermes Desktopを考えるのは、ローカルLLMを使って作業エージェント、ツール連携、プロファイル管理、複数プロバイダーの切り替えなどを試したくなってからで遅くありません。
初心者は「LM Studio = エンジン側」「Hermes Desktop = 操縦席側」「Hermes Agent = 作業を進めるエージェント側」と分けて理解すると、設定画面で迷いにくくなります。
Hermes DesktopとLM Studioの違いを一言でいうと
LM StudioはローカルLLMを動かすための土台です。モデルを検索し、ダウンロードし、PCのメモリやGPUに読み込み、チャットUIやローカルAPIとして使える状態にします。公式ドキュメントでも、LM Studioはローカルモデルを動かし、OpenAI互換APIやREST APIで提供できるツールとして説明されています。
Hermes Desktopは、Hermes Agentをデスクトップアプリから導入、設定、チャット、プロファイル管理、ツールやスキル管理に使いやすくするためのアプリです。Hermes DesktopのREADMEでは、Hermes Agentをインストール、設定、日常利用するためのGUIとして説明され、LM Studioを含むlocal OpenAI-compatible endpointsに対応することが示されています。
つまり、LM Studioが「モデルを動かす側」なら、Hermes Desktopは「そのモデルを使ってHermes Agentに作業させる側」です。競合というより、つなげて使う場面がある別レイヤーのツールです。
役割比較表
| 比較軸 | LM Studio | Hermes Desktop | Hermes Agent |
|---|---|---|---|
| 何をするツールか | ローカルLLMの検索、ダウンロード、読み込み、チャット、API提供を行う | Hermes Agentの導入、設定、チャット、プロファイル、ツール管理をGUIで扱う | モデルプロバイダーを使って作業するエージェント本体 |
| モデルを直接ロードするか | はい。GGUFや対応形式のモデルをPC上で読み込む | 通常は直接ロードしない。LM StudioやOllamaなどのプロバイダーへつなぐ | プロバイダー設定を通じてモデルを利用する |
| ローカルサーバーとして使うか | 使える。local serverを起動し、既定では1234番ポートがよく使われる | Hermes Desktop自体はLM Studioのlocal serverではない | ローカルまたはリモートの実行環境、モデルプロバイダーを使う |
| 初心者が最初に触るべきか | ローカルLLM入門では最初の候補になりやすい | LM Studio単体に慣れた後の検証候補 | Hermesを使うなら理解しておきたい本体 |
| APIキーが必要か | ローカル利用だけなら不要な場合が多いが、認証設定や外部サービス利用では変わる | 選ぶプロバイダー次第。クラウドAPIなら必要、ローカルendpointなら不要な場合がある | 選ぶモデルプロバイダーや連携先によって変わる |
| GGUFモデルとの関係 | GGUFモデルを動かす入口になりやすい | GGUFを直接読むアプリではなく、GGUFを動かしているLM Studioなどに接続する | GGUFそのものではなく、プロバイダー越しにモデルを使う |
| Ollamaとの関係 | Ollamaとは別のモデル実行環境。GUI寄り | LM StudioだけでなくOllamaなどにもつなげる発想 | Ollamaもモデルプロバイダー候補になり得る |
| どんな人に向くか | まずローカルLLMを触りたい人、モデルを比べたい人 | エージェント、ツール、複数プロバイダー、作業管理を試したい人 | チャットを超えた作業支援を構成したい人 |
この表で大事なのは、どちらが上位か下位かではありません。LM Studioはモデル実行の入口、Hermes DesktopはHermes Agentの操作入口です。初心者がつまずくのは、ここを同じ種類のアプリとして比べてしまう時です。
図解風に見る全体構造
- ユーザーがHermes Desktopから指示を出す
- Hermes DesktopがHermes Agentのチャット、設定、プロファイルなどを扱いやすくする
- Hermes Agentが設定済みのモデルプロバイダーを使う
- モデルプロバイダーとしてLM Studio local serverへリクエストを送る
- LM Studioが読み込み済み、または利用可能なローカルLLMモデルで応答を返す
文章で書くと、「ユーザー → Hermes Desktop → Hermes Agent → LM Studio local server → ローカルLLMモデル」という流れです。LM Studio側でモデルが読み込まれていなかったり、local serverが動いていなかったりすると、Hermes側だけを触っても期待通りには動きません。
LM Studio公式のHermes連携ページでも、まずLM Studioをserverとして起動し、その後Hermes側でLM Studioをmodel providerとして選ぶ流れが説明されています。したがって、接続設定を考える時は「Hermes側の設定」と「LM Studio側のサーバー状態」を分けて見る必要があります。
LM Studioだけで十分な人
次のような目的なら、Hermes Desktopを追加しなくてもLM Studioだけで十分なことが多いです。
- ローカルLLMで短いチャットを試したい
- 日本語の質問にどのモデルが答えやすいか比べたい
- GGUFモデル、Q4/Q5/Q8、7B/8B/13Bの違いを体感したい
- 自分のPCでどの程度のモデルが動くか知りたい
- API連携よりも画面上のチャットを優先したい
- まだツール実行やファイル操作をAIに任せる予定がない
この段階では、LM Studioで軽めのモデルを1本動かし、短い質問、長めの文章、少し重い日本語タスクを試すほうが学びが多いです。Hermes Desktopを先に入れると、モデルの重さ、サーバー接続、エージェント設定、ツール権限が同時に出てきて、原因切り分けが難しくなります。
Hermes Desktopを追加で試す価値がある人
Hermes Desktopは、単なるローカルチャットの次に進みたい人に向いています。たとえば、チャット履歴やプロファイルを分けたい、ツールやスキルを使って作業を進めたい、スケジュール実行や複数の連携先を試したい、といった場面です。
質問応答だけでなく、手順化、ツール利用、セッション管理を試したい人に向きます。
LM Studio、Ollama、クラウドAPIなどを用途で分ける発想がある場合に検討価値があります。
検証用、本番用、用途別の環境を分けたい時にHermes側の考え方が役立ちます。
ただし、Hermes Desktopを入れたからといって、ローカルLLMが自動で軽くなるわけではありません。応答の速さや安定性は、最終的にはLM Studioで読み込むモデル、PCメモリ、VRAM、コンテキスト長、同時に動いているアプリに大きく左右されます。
よくある勘違い
- Hermes Desktopを入れればモデルが軽くなる
- なりません。モデルの重さはLM Studio側で選ぶモデル、量子化、コンテキスト長、PC性能に左右されます。
- LM Studioのモデルロードが不要になる
- 不要になるとは限りません。ローカルLLMを使うなら、LM Studio側でモデルを使える状態にする必要があります。
- ローカルだから常にAPIキー不要
- ローカルendpointでは不要な場合がありますが、クラウドプロバイダー、認証設定、ネットワーク公開の設定では変わります。
- OpenAI互換APIはOpenAIの有料APIを必ず使う意味
- 違います。OpenAI風のリクエスト形式やendpointに合わせるという意味で、LM Studioのlocal serverを指す場合もあります。
- Hermes DesktopはLM Studioの代替
- 代替ではありません。LM Studioはモデル実行側、Hermes DesktopはHermes Agentの操作側です。
- 重いモデルでもHermes側なら速くなる
- なりません。重いモデルを選べば、Hermesから使っても遅くなる可能性があります。
特に「OpenAI互換API」という言葉は初心者を混乱させやすいです。これは「OpenAIのAPIサーバーへ必ず接続する」という意味ではなく、「OpenAIのAPIに似た形式でローカルサーバーへ話しかけられる」という意味で使われることがあります。
初心者向けのおすすめ構成
- まずLM Studio単体で軽めのローカルLLMを動かす
- 短いチャットで、モデルが自分のPC上で安定して返答するか確認する
- LM Studioのlocal serverを起動し、既定ポート1234または自分で設定したポートを確認する
- Hermes側でLM Studioをmodel providerとして設定する
- 最初は小さいモデル、短い質問、短いコンテキストで接続確認する
- 接続できた後に、用途に応じてモデル、コンテキスト長、プロバイダーを変える
最初から大きなモデル、長いコンテキスト、複数ツール、複数プロバイダーを同時に試すと、失敗した時に原因が見えなくなります。接続確認では、性能よりも「確実に返答が返ること」を優先してください。
LM Studio local serverとbase URLの考え方
LM StudioをHermes Agentのモデルプロバイダーとして使う時は、LM Studioがlocal serverとしてリクエストを受けられる状態になっている必要があります。LM Studio公式のHermes連携ページでは、serverの既定ポートとして1234が示され、CLIでは `lms server start --port 1234` の例が出ています。
OpenAI互換APIとして使う場合、base URLは一般に `http://localhost:1234/v1` や `http://127.0.0.1:1234/v1` のような形で考えます。ただし、ポートを変更した場合、Hermes側も同じポートに合わせる必要があります。
ここで大切なのは、base URLは「モデル名」ではなく「LM StudioのAPI入口」を指すということです。モデルIDやモデル名は別の設定として扱われる場合があります。
Ollamaとの違いも短く整理する
OllamaもHermes Agentのモデルプロバイダー候補になり得ます。Ollama公式のHermes連携ページでは、Ollama側のOpenAI互換endpointとして `http://127.0.0.1:11434/v1` が示されています。一方、LM Studio公式のHermes連携ページではLM Studio local serverの既定ポート1234が示されています。
初心者向けにざっくり言うと、LM StudioはGUIでモデルを探して試しやすく、OllamaはコマンドやAPI連携に寄った使い方がしやすいです。ただし、どちらが常に速い、どちらが常に簡単、という断定はできません。モデル、環境、設定、目的で変わります。
Hermes Desktopから見ると、LM StudioもOllamaも「モデルプロバイダー」の候補です。違いは、モデルの管理方法、endpoint、ポート、認証、モデルIDの扱いに出ます。
この記事のまとめ
Hermes DesktopとLM Studioは、同じローカルAI周辺にありますが、役割が違います。LM Studioはモデルを動かす側、Hermes DesktopはHermes Agentを扱いやすくする側、Hermes Agentはプロバイダーを使って作業するエージェント側です。
初心者は、最初にLM Studio単体でモデルを動かし、次にlocal serverを起動し、最後にHermes側でLM Studioをproviderとして設定する順番が安全です。つながらない時は、Hermes側だけでなく、LM Studio側のモデルロード、server起動、base URL、model IDを分けて確認してください。
- Hermes Desktopとは?親記事へ戻る - Hermes Desktop全体の位置づけとWindowsでの注意点を確認する
- Hermes DesktopでLM Studioにつながらない時の確認ポイント - 接続エラー、モデル一覧、port 1234、base URLを切り分ける
- GGUFとは - LM Studioで使うモデルファイルと量子化の前提を確認する
- Q4/Q5/Q8の違い - 重さと品質のバランスを理解する
- LM Studioで最初に選ぶモデル - 軽いモデルで接続確認する前提を作る
次に確認すること
Hermes DesktopとLM Studioの役割が分かったら、次は「モデルが重い問題」なのか「API接続の問題」なのか「Hermes Agentとの関係が曖昧なのか」を分けます。関連ページを最後にまとめて読むより、詰まった場所ごとに移動した方が早いです。
- Hermes Desktop全体の親記事へ戻る - Windows初心者向けの位置づけと注意点を確認する
- LM Studioにつながらない時の確認 - base URL、port、model IDを順番に見る
- Ollamaでつなぐ場合 - LM StudioではなくOllamaをproviderにする場合の考え方へ進む
- Hermes AgentとDesktopの違い - GUIと本体、モデルプロバイダーの関係を整理する
- GGUFの基礎 - LM Studioで扱うモデルファイルの基本を確認する
- Q4/Q5/Q8の違い - 重いモデルを選んでいないか見直す
- API serverの基礎 - OpenAI互換API、/v1、base URLの意味を確認する
- LM Studioで最初に選ぶモデル - 接続確認に向いた軽いモデルを選ぶ
- LM StudioとOllamaの違い - モデル実行側をどちらにするか比較する
よくある質問
初心者はどこで詰まりやすい?
LM Studioを起動しただけでモデルが使えると思う、local serverを起動していない、base URLのポートが違う、model IDがずれている、重すぎるモデルを選ぶ、という点で詰まりやすいです。
LM Studioだけでエージェント的な作業はできない?
LM StudioにもAPIやMCP関連機能がありますが、Hermes Agentとは役割が違います。どこまでをLM Studioで行い、どこからHermes側に任せるかは目的で分けて考えるのが安全です。
Hermes Desktopを使うとローカルLLMの品質は上がる?
モデル自体の品質が自動で上がるわけではありません。Hermes側は作業の進め方やツール利用の層であり、回答品質や速度は選んだモデル、設定、PC性能の影響を受けます。
Hermes DesktopはLM Studioの代わりになりますか?
いいえ。LM StudioはローカルLLMを読み込み、Local Serverやチャットとして提供する側です。Hermes DesktopはHermes AgentをGUIで扱い、LM Studioなどのモデルプロバイダーへつなぐ側です。
LLM StudioとLM Studioは同じですか?
公式名称はLM Studioです。検索ではLLM Studioと書かれることがありますが、この記事ではLM Studioとして扱います。設定では公式画面の名称と表示値を優先してください。
Base URLは何を入れればいいですか?
LM StudioのServer画面に表示されているURLを優先してください。例として http://localhost:1234/v1 が使われることがありますが、portや /v1 の有無は現在の画面に合わせます。
Model IDはGGUFファイル名と同じですか?
同じとは限りません。LM Studioのモデル一覧やAPIが公開する実際のIDを確認し、Hermes Desktop側へ合わせます。
LM Studio単体では返答するのにHermes Desktopでは失敗します。
Local Server、Base URL、Model ID、API key、認証設定、起動中モデルを順に確認してください。詳しい切り分けはトラブルシュート記事へ進んでください。
LM Studio接続にAPI keyは必要ですか?
ローカル接続では不要な構成があります。LM Studio側で認証を有効にした場合や入力必須の接続画面では、その設定に従ってください。
GGUFモデルはHermes Desktopが直接読みますか?
基本的には、GGUFはLM Studioなどのモデル実行側で読み込みます。Hermes Desktopはそのlocal serverやproviderへ接続して使う側として考えると混乱しにくいです。
OllamaとLM Studioはどちらが簡単ですか?
Windows初心者が画面で状態を確認しながら始めるならLM Studioが分かりやすい傾向です。CLIやAPI連携に慣れているならOllamaも選びやすい候補です。
次に読むおすすめルート
開発・API連携したい人
LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
- ローカルAIをAPIで使う方法
- ローカルAIでJSON出力する方法
- LM StudioとOllamaの違い
- コンテキスト長とは
- RAG・埋め込み・ベクトルDBの仕組み
- RAG評価と引用確認の基礎
- faithfulness確認
- ローカルRAGのプライバシー
- MCPとは
- ローカルLLMの安全性とプライバシー
- Gemma 4 12Bの更新メモ
- Hermes Desktopとは
- Hermes DesktopとOllama接続
- Hermes Desktop接続トラブル
- Hermes DesktopでOpenRouterを使う
- Hermes DesktopでDeepSeek APIを使う
- Hermes DesktopでProviderを使い分ける
- Hermes DesktopとLM Studio接続の確認ポイント
- Hermes AgentとDesktopの違い
- Ollamaとは
- Ollamaの解説
- 診断基準
- 比較表
あなたはどのタイプ?
- 初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
- PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
- 開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
関連チェック先
- LM Studio Docs - LM Studioのアプリ、ローカルモデル、GGUF実行、オフライン利用、API機能の公式説明です。
- LM Studio Local LLM API Server - Developer / Server、local server、起動方法、server設定の公式説明です。
- LM Studio OpenAI Compatibility Endpoints - OpenAI互換APIのbase URLやendpointの考え方を確認できます。
- LM Studio List Models - local serverから見えるmodel IDを確認する公式ページです。
- LM Studio Hermes Agent integration - Hermes AgentでLM Studioをmodel providerとして使う公式連携ページです。
- Hermes Agent official - Hermes Agent本体の公式サイトです。
- NousResearch/hermes-agent GitHub - Hermes Agentの公式GitHubリポジトリです。
- fathah/hermes-desktop GitHub - Hermes DesktopのREADME、機能、provider対応を確認できます。
- Ollama Docs: Hermes Agent - OllamaをHermes Agentから使う場合の公式連携情報です。
- Sustainable LLM Inference for Edge AI - Raspberry Pi 4 4GB RAM上で、Ollama library由来の量子化LLMを速度、精度、電力の観点から評価した研究です。
- Which Quantization Should I Use? - llama.cpp量子化形式をLlama-3.1-8B-Instructで統一評価した研究です。単一モデル評価として扱います。
- ggml GGUF specification - GGUFがtensorとmetadataを含む推論用ファイル形式であることを確認できます。
- ggml-org/llama.cpp - GGUFモデルをCPU/GPUで実行する代表的な実装です。
- Ollama Docs - Ollamaの公式ドキュメントです。
- Hugging Face Models - モデルカード、ライセンス、配布元、intended useを確認する入口です。