ローカルAIをAPIで使うには?LM Studio・Ollama・JanのOpenAI互換APIを初心者向けに解説

公開日
2026-06-06
更新日
2026-06-20
情報確認日
2026-06-06

ローカルAIは、チャット画面で使うだけでなく、APIサーバーとして動かして自分のアプリやスクリプトから呼び出せます。LM Studio、Ollama、JanにはOpenAI互換APIとして使える機能があり、既存のOpenAI向けコードを一部変更して使える場合があります。ただし、ポート番号、対応API、モデル、セキュリティ設定はツールごとに違うため、まずはlocalhostで小さく試すのが安全です。

導入前に確認すること

  • Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
  • 最初は軽量モデル、短い質問、少ない同時作業から始める
  • 公式サイトの対応OS、利用規約、モデルのライセンスを確認する

Hermes Desktopでつながらない時の読み順

Hermes Desktopの設定を何度も変える前に、症状別ハブで provider 側、base URL、model ID、API key、PC負荷を分けて確認してください。

ローカルAIをAPIで使うとは

APIは、別のアプリやコードからAIに指示を送る窓口です。チャット画面に文章を入力する代わりに、Python、JavaScript、自作ツール、ノートアプリ、RAGツールなどからローカルAIへリクエストを送ります。

ローカルAI APIを使うと、文章の下書き、要約、分類、翻訳、メモ整理、個人開発アプリへのAI機能追加などに進めます。ただし、APIで呼び出してもモデルが重ければ遅く、モデルサイズ、量子化、コンテキスト長、メモリ、VRAMの影響は残ります。

APIサーバーとは何か

APIサーバーとは、別のアプリからのリクエストを待ち受ける小さな窓口です。LM StudioやJanのデスクトップアプリ、Ollamaのような常駐プロセスを起動し、そこへコードや別ツールから接続します。

初心者は外部公開やLAN公開を急がず、自分のPC内だけで動くlocalhostから始めてください。localhostは「自分のPC自身」を指す住所のようなもので、最初の検証では外部へ開けないほうが安全です。

OpenAI互換APIとは何か

OpenAI互換APIは、OpenAI向けに作られたコードやツールを、ローカルAIのサーバーへ向け替えられる可能性がある仕組みです。たとえばbase URLをOpenAIではなくlocalhostのアドレスに変えることで、同じような形でチャット補完を呼び出せる場合があります。

ただし、完全互換ではありません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込み、レスポンス形式はツールやバージョンごとに異なります。「OpenAI互換だから何でも同じ」と考えず、使う機能ごとに公式ドキュメントを確認してください。

LM Studio / Ollama / Jan のAPI比較表

ツールAPIの使いやすさOpenAI互換APIGUIの有無初心者向け度向いている用途注意点
LM StudioGUIから始めやすい対応範囲ありあり高めローカルモデルを起動し、localhostのAPIとして試すポートやサーバー起動状態、モデル読み込みを確認する
Ollamaコマンドに慣れると扱いやすい対応範囲あり基本はコマンド/API中くらい開発、常駐API、他ツール連携モデル名、コンテキスト設定、対応APIの違いを確認する
Janアプリ内設定を確認して使う対応範囲ありあり中くらい自分用AIアプリ、ローカルAPI、外部API比較ローカル利用とクラウド/API接続でプライバシー前提が変わる

LM StudioのAPIでできること

LM StudioはローカルLLM APIサーバーとして使える機能があり、公式ドキュメントではREST API、SDK、OpenAI互換エンドポイントが案内されています。例ではlocalhostのポートを指定して呼び出す形が示されていますが、実際のポート番号やUI名は設定で変わる場合があります。

LM StudioはGUIでモデルを選び、読み込んでからAPIとして試しやすい点が入口になります。まず短い質問でモデル単体の速度を確認し、そのあとAPI呼び出しへ進むと原因を切り分けやすくなります。

OllamaのAPIでできること

OllamaはAPIやOpenAI互換APIを使った連携に向きます。公式ドキュメントではデフォルトのlocalhost API、Python/JavaScriptライブラリ、OpenAI互換のbase URLが案内されています。

コマンド操作に抵抗がない人なら、Ollamaは個人開発や自動化の土台にしやすいです。一方で、完全初心者はモデル名、実行状態、コンテキスト設定、停止方法を混同しやすいので、まず単体のチャット動作を確認してください。

JanのローカルAPIサーバーでできること

Janの公式APIドキュメントでは、OpenAI互換APIとしてローカルAPIサーバーやJan Serverの情報が案内されています。ローカルアプリとして使う場合と、外部APIやクラウドAIを接続する場合で、データ送信やプライバシーの前提が変わります。

JanはLM Studioの次に比較したい人、自分用AI環境を作りたい人、API連携も見たい人に向きます。APIだけで判断せず、ローカル実行なのか外部接続なのかを分けて確認してください。

クラウドAPIとローカルAI APIの比較表

比較軸クラウドAPIローカルAI API
料金従量課金やプラン料金が必要になりやすいAPI呼び出し自体はローカルだが、PC購入や電気代、モデル保存容量が必要
速度ネットワークと提供側の性能に依存PC性能、モデルサイズ、量子化、VRAMに依存
セットアップAPIキーとSDKで始めやすい場合が多いモデル、ツール、サーバー起動、ポート確認が必要
プライバシー入力データが外部サービスへ送信されるlocalhostだけならPC内中心だが、外部API連携やLAN公開では前提が変わる
モデル選択提供モデルから選ぶGGUFやOllamaモデルなどを自分で選ぶ
PC負荷手元PCの負荷は少なめCPU、メモリ、GPU、VRAMを使う
安定性提供側の仕様変更や制限を受ける手元環境の設定、発熱、メモリ不足の影響を受ける

PythonやJavaScriptから呼び出すと何ができるか

短いスクリプトから文章の要約、分類、下書き、ファイル名の整理、ログの読み取り補助などを試せます。コード例を使う場合は、まずlocalhostの短いテストに限定し、APIキーや秘密情報を外部へ送らない形にしてください。

既存のOpenAI向けコードを流用する場合でも、base URL、モデル名、対応パラメータをローカルツールに合わせる必要があります。動かないときは、コードより先にAPIサーバーが起動しているか、モデルが読み込まれているかを確認します。

APIで使うときに必要なPCスペック

APIで呼び出すから軽くなるわけではありません。実際には同じモデルを動かしているため、モデルサイズ、Q4/Q5/Q8、コンテキスト長、CPU、GPU、VRAM、同時起動アプリが関係します。

セキュリティで注意すること

外部公開やLAN公開を安易に勧めません。最初はlocalhostだけで動かし、必要が出た場合だけ、認証、ファイアウォール、CORS、接続元、ログ、入力データの扱いを確認してください。

クラウドAPIや外部APIへ接続する場合は、入力した文章やファイルの一部が外部へ送信される可能性があります。社内文書、顧客情報、個人情報、秘密情報を扱う前に、公式情報、利用規約、会社や案件のルールを確認してください。

初心者はどこから始めるべきか

最初はLM StudioまたはOllamaで軽いモデルを1つ動かし、短い日本語質問に答えられるか確認します。次にlocalhostのAPIへ短いリクエストを送り、最後に自分のスクリプトやツールへつなげる順番が安全です。

次に読む記事

よくある質問

ローカルAI APIは無料で使えますか?

localhostで動かすローカルAI APIの呼び出し自体は、クラウドAPIのような従量課金ではない場合が多いです。ただし、PC本体、GPU、電気代、保存容量、使うモデルや連携サービスの条件は別に確認が必要です。

OpenAI互換APIならOpenAIと完全に同じですか?

完全に同じとは限りません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込みなどはLM Studio、Ollama、Janごとに違います。

外部にデータは送信されますか?

localhostだけでローカルモデルを使う場合と、クラウドAIや外部APIに接続する場合で前提が変わります。LAN公開や外部API接続を使う前に設定と公式情報を確認してください。

Pythonが分からなくても使う意味はありますか?

あります。APIの考え方を知っておくと、AnythingLLM、Jan、Ollama、個人開発ツールがどのようにAIへ接続しているか理解しやすくなります。

APIで呼び出せば速くなりますか?

APIにしても同じモデルを動かすため、必ず速くなるわけではありません。モデルサイズ、量子化、コンテキスト長、メモリ、VRAM、CPU/GPUが関係します。

ポート番号は1234や1337で固定ですか?

固定とは限りません。公式例やデフォルトとして示されることはありますが、ツールや設定、バージョンで変わる可能性があります。実際の画面や公式ドキュメントで確認してください。

次に読むおすすめルート

開発・API連携したい人

LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。

  1. ローカルAIでJSON出力する方法
  2. LM StudioとOllamaの違い
  3. コンテキスト長とは
  4. RAG・埋め込み・ベクトルDBの仕組み
  5. RAG評価と引用確認の基礎
  6. faithfulness確認
  7. ローカルRAGのプライバシー
  8. MCPとは
  9. ローカルLLMの安全性とプライバシー
  10. Gemma 4 12Bの更新メモ
  11. Hermes Desktopとは
  12. Hermes DesktopとLM Studio接続
  13. Hermes DesktopとOllama接続
  14. Hermes Desktop接続トラブル
  15. Hermes DesktopでOpenRouterを使う
  16. Hermes DesktopでDeepSeek APIを使う
  17. Hermes DesktopでProviderを使い分ける
  18. Hermes DesktopとLM Studio接続の確認ポイント
  19. Hermes AgentとDesktopの違い
  20. Ollamaとは
  21. Ollamaの解説
  22. 診断基準
  23. 比較表

あなたはどのタイプ?

関連チェック先

  • LM Studio API / Developer Docs - LM StudioのSDK、REST API、OpenAI互換API、ローカルサーバー機能を確認できます。
  • LM Studio Local Server - LM StudioのローカルLLM APIサーバー、localhostやネットワーク公開、起動方法を確認できます。
  • LM Studio OpenAI Compatibility API - LM StudioのOpenAI互換エンドポイント、base URL、対応範囲を確認できます。
  • Ollama API - OllamaのAPI、デフォルトのlocalhost、Python/JavaScriptライブラリを確認できます。
  • Ollama OpenAI Compatibility - OllamaのOpenAI互換API、対応範囲、base URL、注意点を確認できます。
  • Jan API Documentation - JanのOpenAI互換API、ローカルAPIサーバー、Jan Serverの概要を確認できます。

関連ツール

比較表を見る / 最初に検討しやすいツールを確認する