Hermes DesktopとLM Studioを接続する方法|Base URL・Model ID・Local Server確認

公開日
2026-06-07
更新日
2026-06-26
情報確認日
2026-06-26

Hermes DesktopをLM Studioにつなぐ時は、LM Studioでモデルを動かす、Local Serverを起動する、Base URLとModel IDをHermes側へ合わせる、という順番で確認します。この記事は通常手順の担当です。つながらない時の詳細原因はトラブルシュート記事へ分けます。

導入前に確認すること

  • Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
  • 最初は軽量モデル、短い質問、少ない同時作業から始める
  • 公式サイトの対応OS、利用規約、モデルのライセンスを確認する

小型LLMをHermesへつなぐ前に

Hermes Desktopへつなぐ前に、LM Studio単体で軽いQ4/Q5モデルが短い日本語質問に安定して答えるか確認します。接続問題とモデル負荷を混ぜないことが大切です。

Hermes Desktopでつながらない時の読み順

Hermes Desktopの設定を何度も変える前に、症状別ハブで provider 側、base URL、model ID、API key、PC負荷を分けて確認してください。

LLM Studioと検索して来た人へ

この記事では、ローカルLLMアプリの公式名称である「LM Studio」と、検索で見かける「LLM Studio」という表記揺れをまとめて扱います。設定で確認する名前は、LM Studio公式画面・Hermes側のprovider名・実際のModel IDを優先してください。

まず結論:Hermes DesktopとLM Studioは役割が違う

接続の流れは「ユーザー → Hermes Desktop → Hermes Agent → LM Studio Local Server → 読み込み済みGGUFモデル」です。Hermes DesktopがGGUFを直接読むのではなく、LM Studioが読み込んだモデルへHermes Agentが話しかける、と分けて考えると設定が追いやすくなります。

接続前に確認する3つ

  • LM Studioを起動する。
  • 使うGGUFモデルを選ぶ。
  • LM Studio単体チャットで短い日本語質問に返答できるか確認する。
  • Developer / Server系の画面でLocal Serverを起動する。
  • 画面に出ているBase URLを確認する。例は http://localhost:1234/v1 ですが、必ず現在の画面を優先する。
  • /v1/models またはLM Studioのモデル一覧で、Hermes側に入れるModel IDを確認する。
  • Hermes Desktop / Hermes Agent側でLM Studio providerまたはOpenAI互換endpointを設定する。
  • 短い質問で接続確認する。
  • 重い・止まる場合は、GGUF/量子化/PC負荷の記事へ戻る。

設定例:LM StudioとHermes Desktopで同じ値を見る

項目LM Studio側で見る場所Hermes側で合わせるもの間違えやすい点
Local ServerDeveloper / Server画面接続先として利用チャットできてもServer未起動の場合がある
Base URLServer画面に表示されたURLbase_url / endpoint/v1 の有無、port違い
Model IDAPIのmodels一覧・ロード済みモデルmodel欄表示名やGGUFファイル名と一致しない場合がある
API key認証設定必要な場合のみローカルでは不要な構成もある
GGUFモデルモデル管理画面間接的に利用Hermes DesktopがGGUFを直接読むわけではない
  1. LM Studioでモデルをロードし、LM Studio内のチャットで「1+1を一文で答えて」と質問します。
  2. DeveloperまたはServer画面でローカルサーバーを起動し、表示中のBase URLとPortを控えます。
  3. Hermes DesktopでProvider、Base URL、Model IDを同じ接続先に合わせます。
  4. 最初は「こんにちは。日本語で一文だけ返して」のような短い質問で接続だけを確認します。
  5. 接続後に長い指示やツール操作を試します。現在のHermes公式案内ではエージェント用途に大きなコンテキスト長を求める場合があるため、PC負荷も確認します。

LM Studioの標準的なローカルAPIはOpenAI互換形式を提供しますが、画面名・認証・既定ポートはバージョンや設定で変わることがあります。固定値を暗記せず、起動中のServer画面とHermesのモデル一覧を照合してください。

このメイン記事とトラブル記事の役割分担

このページは、初めて接続する人が通常手順を上から確認するためのページです。connection refused、model not found、timeout、401、429などの詳細なエラーは、トラブルシュート記事や症状別ハブへ進んでください。

読みたいこと担当ページ理由
通常の接続手順このページLM Studioでモデルを動かし、Local Server、Base URL、Model IDを合わせる
つながらない時の症状別確認/articles/hermes-desktop-lm-studio-troubleshooting/Local Server未起動、port違い、Model ID不一致、API key、重いモデルを切り分ける
connection refused / model not found/articles/hermes-desktop-errors/症状別ハブから詳細記事へ進む
モデルが重い・止まる/articles/quantization-q4-q5-q8/接続ではなくGGUF/量子化/PC負荷を疑う

LM StudioとOllamaで混ぜやすい接続項目

確認項目LM StudioOllamaHermes側で見ること
モデルが動くか単体チャットで確認ollama runなどで確認まだ触らない
API serverDeveloper tabまたはlms server startOllama service / OpenAI互換endpointbase URLを合わせる
base URL例: http://localhost:1234/v1例: http://127.0.0.1:11434/v1provider設定へ入力
model ID/v1/modelsや画面表示で確認model名/tagを確認指定名と一致させる
遅い/無反応モデルサイズ・GPU offloadモデルサイズ・メモリtimeoutと混同しない

1234や11434は公式ドキュメントで出てくる代表例です。固定値として暗記せず、いま起動しているLM StudioまたはOllamaの画面・設定・ログを優先してください。

LM Studioで使うモデルを選ぶ

PCスペックが厳しい場合は外部APIも候補

軽いGGUFへ下げても速度やメモリが足りない場合は、OpenRouterやDeepSeek APIなど外部APIへ処理を任せる選択肢があります。ただし、その会話はローカル完結ではなくなり、入力内容の外部送信と従量料金が発生する可能性があります。

接続で詰まっている人へ

症状最初に見ること詳しい記事
connection refusedlocal server未起動・port違いconnection refused記事
model not foundmodel ID不一致・モデル未ロードmodel not found記事
返事が遅い・止まるモデルサイズ・GPU offload・context遅い・止まる記事

最短手順:接続前に4か所をそろえる

  1. LM StudioでPCに合う軽いモデルをロードし、短い質問に回答できることを確認する。
  2. LM Studioのlocal serverを起動し、画面に表示されたbase URLとportを控える。
  3. Hermes Desktopのモデルプロバイダー設定で、対応する接続方式とbase URLを指定する。
  4. Hermes側のmodel IDをLM Studio側と一致させ、短い質問で接続を確認する。

URLや設定項目名はバージョンによって変わることがあります。固定値を暗記するより、LM Studioのサーバー画面に現在表示されている値を使う方が確実です。

LM Studio側とHermes側で見る場所

確認項目LM Studio側Hermes Desktop側
モデルロード済みか、単体で回答するかmodel IDが一致しているか
APIlocal serverが起動中か対応するproviderを選んだか
URL表示中のhostとportbase URLに同じ値を入れたか
エラーserver logやモデルロード失敗接続エラーまたは認証エラー

接続テストは軽い条件で行う

  • 最初は7B/8B級の軽いInstructモデルと短い質問を使う。
  • 長いシステムプロンプト、ツール実行、PDF参照は接続後に追加する。
  • CPU 100%やメモリ逼迫がある場合は、接続ではなくモデル負荷の問題を疑う。
  • localhostで失敗した場合は、実際のhost表示とアプリの実行環境を確認する。

冒頭の3行結論

  • Hermes DesktopはLM Studioの代わりではありません。ローカルLLMを直接ロードする主役はLM Studio側です。
  • LM Studioは、モデルを探す、落とす、読み込む、local serverとして提供するためのアプリです。
  • Hermes Desktopは、Hermes AgentをGUIで扱いやすくし、LM Studioなどのモデルプロバイダーへつなぐ操作側です。

まず単体でチャットしたいだけなら、LM Studioだけで十分なことが多いです。Hermes Desktopを考えるのは、ローカルLLMを使って作業エージェント、ツール連携、プロファイル管理、複数プロバイダーの切り替えなどを試したくなってからで遅くありません。

初心者は「LM Studio = エンジン側」「Hermes Desktop = 操縦席側」「Hermes Agent = 作業を進めるエージェント側」と分けて理解すると、設定画面で迷いにくくなります。

Hermes DesktopとLM Studioの違いを一言でいうと

LM StudioはローカルLLMを動かすための土台です。モデルを検索し、ダウンロードし、PCのメモリやGPUに読み込み、チャットUIやローカルAPIとして使える状態にします。公式ドキュメントでも、LM Studioはローカルモデルを動かし、OpenAI互換APIやREST APIで提供できるツールとして説明されています。

Hermes Desktopは、Hermes Agentをデスクトップアプリから導入、設定、チャット、プロファイル管理、ツールやスキル管理に使いやすくするためのアプリです。Hermes DesktopのREADMEでは、Hermes Agentをインストール、設定、日常利用するためのGUIとして説明され、LM Studioを含むlocal OpenAI-compatible endpointsに対応することが示されています。

つまり、LM Studioが「モデルを動かす側」なら、Hermes Desktopは「そのモデルを使ってHermes Agentに作業させる側」です。競合というより、つなげて使う場面がある別レイヤーのツールです。

役割比較表

比較軸LM StudioHermes DesktopHermes Agent
何をするツールかローカルLLMの検索、ダウンロード、読み込み、チャット、API提供を行うHermes Agentの導入、設定、チャット、プロファイル、ツール管理をGUIで扱うモデルプロバイダーを使って作業するエージェント本体
モデルを直接ロードするかはい。GGUFや対応形式のモデルをPC上で読み込む通常は直接ロードしない。LM StudioやOllamaなどのプロバイダーへつなぐプロバイダー設定を通じてモデルを利用する
ローカルサーバーとして使うか使える。local serverを起動し、既定では1234番ポートがよく使われるHermes Desktop自体はLM Studioのlocal serverではないローカルまたはリモートの実行環境、モデルプロバイダーを使う
初心者が最初に触るべきかローカルLLM入門では最初の候補になりやすいLM Studio単体に慣れた後の検証候補Hermesを使うなら理解しておきたい本体
APIキーが必要かローカル利用だけなら不要な場合が多いが、認証設定や外部サービス利用では変わる選ぶプロバイダー次第。クラウドAPIなら必要、ローカルendpointなら不要な場合がある選ぶモデルプロバイダーや連携先によって変わる
GGUFモデルとの関係GGUFモデルを動かす入口になりやすいGGUFを直接読むアプリではなく、GGUFを動かしているLM Studioなどに接続するGGUFそのものではなく、プロバイダー越しにモデルを使う
Ollamaとの関係Ollamaとは別のモデル実行環境。GUI寄りLM StudioだけでなくOllamaなどにもつなげる発想Ollamaもモデルプロバイダー候補になり得る
どんな人に向くかまずローカルLLMを触りたい人、モデルを比べたい人エージェント、ツール、複数プロバイダー、作業管理を試したい人チャットを超えた作業支援を構成したい人

この表で大事なのは、どちらが上位か下位かではありません。LM Studioはモデル実行の入口、Hermes DesktopはHermes Agentの操作入口です。初心者がつまずくのは、ここを同じ種類のアプリとして比べてしまう時です。

図解風に見る全体構造

  1. ユーザーがHermes Desktopから指示を出す
  2. Hermes DesktopがHermes Agentのチャット、設定、プロファイルなどを扱いやすくする
  3. Hermes Agentが設定済みのモデルプロバイダーを使う
  4. モデルプロバイダーとしてLM Studio local serverへリクエストを送る
  5. LM Studioが読み込み済み、または利用可能なローカルLLMモデルで応答を返す

文章で書くと、「ユーザー → Hermes Desktop → Hermes Agent → LM Studio local server → ローカルLLMモデル」という流れです。LM Studio側でモデルが読み込まれていなかったり、local serverが動いていなかったりすると、Hermes側だけを触っても期待通りには動きません。

LM Studio公式のHermes連携ページでも、まずLM Studioをserverとして起動し、その後Hermes側でLM Studioをmodel providerとして選ぶ流れが説明されています。したがって、接続設定を考える時は「Hermes側の設定」と「LM Studio側のサーバー状態」を分けて見る必要があります。

LM Studioだけで十分な人

次のような目的なら、Hermes Desktopを追加しなくてもLM Studioだけで十分なことが多いです。

  • ローカルLLMで短いチャットを試したい
  • 日本語の質問にどのモデルが答えやすいか比べたい
  • GGUFモデル、Q4/Q5/Q8、7B/8B/13Bの違いを体感したい
  • 自分のPCでどの程度のモデルが動くか知りたい
  • API連携よりも画面上のチャットを優先したい
  • まだツール実行やファイル操作をAIに任せる予定がない

この段階では、LM Studioで軽めのモデルを1本動かし、短い質問、長めの文章、少し重い日本語タスクを試すほうが学びが多いです。Hermes Desktopを先に入れると、モデルの重さ、サーバー接続、エージェント設定、ツール権限が同時に出てきて、原因切り分けが難しくなります。

Hermes Desktopを追加で試す価値がある人

Hermes Desktopは、単なるローカルチャットの次に進みたい人に向いています。たとえば、チャット履歴やプロファイルを分けたい、ツールやスキルを使って作業を進めたい、スケジュール実行や複数の連携先を試したい、といった場面です。

ただし、Hermes Desktopを入れたからといって、ローカルLLMが自動で軽くなるわけではありません。応答の速さや安定性は、最終的にはLM Studioで読み込むモデル、PCメモリ、VRAM、コンテキスト長、同時に動いているアプリに大きく左右されます。

よくある勘違い

Hermes Desktopを入れればモデルが軽くなる
なりません。モデルの重さはLM Studio側で選ぶモデル、量子化、コンテキスト長、PC性能に左右されます。
LM Studioのモデルロードが不要になる
不要になるとは限りません。ローカルLLMを使うなら、LM Studio側でモデルを使える状態にする必要があります。
ローカルだから常にAPIキー不要
ローカルendpointでは不要な場合がありますが、クラウドプロバイダー、認証設定、ネットワーク公開の設定では変わります。
OpenAI互換APIはOpenAIの有料APIを必ず使う意味
違います。OpenAI風のリクエスト形式やendpointに合わせるという意味で、LM Studioのlocal serverを指す場合もあります。
Hermes DesktopはLM Studioの代替
代替ではありません。LM Studioはモデル実行側、Hermes DesktopはHermes Agentの操作側です。
重いモデルでもHermes側なら速くなる
なりません。重いモデルを選べば、Hermesから使っても遅くなる可能性があります。

特に「OpenAI互換API」という言葉は初心者を混乱させやすいです。これは「OpenAIのAPIサーバーへ必ず接続する」という意味ではなく、「OpenAIのAPIに似た形式でローカルサーバーへ話しかけられる」という意味で使われることがあります。

初心者向けのおすすめ構成

  1. まずLM Studio単体で軽めのローカルLLMを動かす
  2. 短いチャットで、モデルが自分のPC上で安定して返答するか確認する
  3. LM Studioのlocal serverを起動し、既定ポート1234または自分で設定したポートを確認する
  4. Hermes側でLM Studioをmodel providerとして設定する
  5. 最初は小さいモデル、短い質問、短いコンテキストで接続確認する
  6. 接続できた後に、用途に応じてモデル、コンテキスト長、プロバイダーを変える

最初から大きなモデル、長いコンテキスト、複数ツール、複数プロバイダーを同時に試すと、失敗した時に原因が見えなくなります。接続確認では、性能よりも「確実に返答が返ること」を優先してください。

LM Studio local serverとbase URLの考え方

LM StudioをHermes Agentのモデルプロバイダーとして使う時は、LM Studioがlocal serverとしてリクエストを受けられる状態になっている必要があります。LM Studio公式のHermes連携ページでは、serverの既定ポートとして1234が示され、CLIでは `lms server start --port 1234` の例が出ています。

OpenAI互換APIとして使う場合、base URLは一般に `http://localhost:1234/v1` や `http://127.0.0.1:1234/v1` のような形で考えます。ただし、ポートを変更した場合、Hermes側も同じポートに合わせる必要があります。

ここで大切なのは、base URLは「モデル名」ではなく「LM StudioのAPI入口」を指すということです。モデルIDやモデル名は別の設定として扱われる場合があります。

Ollamaとの違いも短く整理する

OllamaもHermes Agentのモデルプロバイダー候補になり得ます。Ollama公式のHermes連携ページでは、Ollama側のOpenAI互換endpointとして `http://127.0.0.1:11434/v1` が示されています。一方、LM Studio公式のHermes連携ページではLM Studio local serverの既定ポート1234が示されています。

初心者向けにざっくり言うと、LM StudioはGUIでモデルを探して試しやすく、OllamaはコマンドやAPI連携に寄った使い方がしやすいです。ただし、どちらが常に速い、どちらが常に簡単、という断定はできません。モデル、環境、設定、目的で変わります。

Hermes Desktopから見ると、LM StudioもOllamaも「モデルプロバイダー」の候補です。違いは、モデルの管理方法、endpoint、ポート、認証、モデルIDの扱いに出ます。

この記事のまとめ

Hermes DesktopとLM Studioは、同じローカルAI周辺にありますが、役割が違います。LM Studioはモデルを動かす側、Hermes DesktopはHermes Agentを扱いやすくする側、Hermes Agentはプロバイダーを使って作業するエージェント側です。

初心者は、最初にLM Studio単体でモデルを動かし、次にlocal serverを起動し、最後にHermes側でLM Studioをproviderとして設定する順番が安全です。つながらない時は、Hermes側だけでなく、LM Studio側のモデルロード、server起動、base URL、model IDを分けて確認してください。

次に確認すること

Hermes DesktopとLM Studioの役割が分かったら、次は「モデルが重い問題」なのか「API接続の問題」なのか「Hermes Agentとの関係が曖昧なのか」を分けます。関連ページを最後にまとめて読むより、詰まった場所ごとに移動した方が早いです。

よくある質問

初心者はどこで詰まりやすい?

LM Studioを起動しただけでモデルが使えると思う、local serverを起動していない、base URLのポートが違う、model IDがずれている、重すぎるモデルを選ぶ、という点で詰まりやすいです。

LM Studioだけでエージェント的な作業はできない?

LM StudioにもAPIやMCP関連機能がありますが、Hermes Agentとは役割が違います。どこまでをLM Studioで行い、どこからHermes側に任せるかは目的で分けて考えるのが安全です。

Hermes Desktopを使うとローカルLLMの品質は上がる?

モデル自体の品質が自動で上がるわけではありません。Hermes側は作業の進め方やツール利用の層であり、回答品質や速度は選んだモデル、設定、PC性能の影響を受けます。

Hermes DesktopはLM Studioの代わりになりますか?

いいえ。LM StudioはローカルLLMを読み込み、Local Serverやチャットとして提供する側です。Hermes DesktopはHermes AgentをGUIで扱い、LM Studioなどのモデルプロバイダーへつなぐ側です。

LLM StudioとLM Studioは同じですか?

公式名称はLM Studioです。検索ではLLM Studioと書かれることがありますが、この記事ではLM Studioとして扱います。設定では公式画面の名称と表示値を優先してください。

Base URLは何を入れればいいですか?

LM StudioのServer画面に表示されているURLを優先してください。例として http://localhost:1234/v1 が使われることがありますが、portや /v1 の有無は現在の画面に合わせます。

Model IDはGGUFファイル名と同じですか?

同じとは限りません。LM Studioのモデル一覧やAPIが公開する実際のIDを確認し、Hermes Desktop側へ合わせます。

LM Studio単体では返答するのにHermes Desktopでは失敗します。

Local Server、Base URL、Model ID、API key、認証設定、起動中モデルを順に確認してください。詳しい切り分けはトラブルシュート記事へ進んでください。

LM Studio接続にAPI keyは必要ですか?

ローカル接続では不要な構成があります。LM Studio側で認証を有効にした場合や入力必須の接続画面では、その設定に従ってください。

GGUFモデルはHermes Desktopが直接読みますか?

基本的には、GGUFはLM Studioなどのモデル実行側で読み込みます。Hermes Desktopはそのlocal serverやproviderへ接続して使う側として考えると混乱しにくいです。

OllamaとLM Studioはどちらが簡単ですか?

Windows初心者が画面で状態を確認しながら始めるならLM Studioが分かりやすい傾向です。CLIやAPI連携に慣れているならOllamaも選びやすい候補です。

次に読むおすすめルート

開発・API連携したい人

LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。

  1. ローカルAIをAPIで使う方法
  2. ローカルAIでJSON出力する方法
  3. LM StudioとOllamaの違い
  4. コンテキスト長とは
  5. RAG・埋め込み・ベクトルDBの仕組み
  6. RAG評価と引用確認の基礎
  7. faithfulness確認
  8. ローカルRAGのプライバシー
  9. MCPとは
  10. ローカルLLMの安全性とプライバシー
  11. Gemma 4 12Bの更新メモ
  12. Hermes Desktopとは
  13. Hermes DesktopとOllama接続
  14. Hermes Desktop接続トラブル
  15. Hermes DesktopでOpenRouterを使う
  16. Hermes DesktopでDeepSeek APIを使う
  17. Hermes DesktopでProviderを使い分ける
  18. Hermes DesktopとLM Studio接続の確認ポイント
  19. Hermes AgentとDesktopの違い
  20. Ollamaとは
  21. Ollamaの解説
  22. 診断基準
  23. 比較表

あなたはどのタイプ?

関連チェック先

関連ツール

比較表を見る / 最初に検討しやすいツールを確認する