ローカルAIをAPIで使うには?LM Studio・Ollama・JanのOpenAI互換APIを初心者向けに解説
- 公開日
- 2026-06-06
- 更新日
- 2026-06-20
- 情報確認日
- 2026-06-06
ローカルAIは、チャット画面で使うだけでなく、APIサーバーとして動かして自分のアプリやスクリプトから呼び出せます。LM Studio、Ollama、JanにはOpenAI互換APIとして使える機能があり、既存のOpenAI向けコードを一部変更して使える場合があります。ただし、ポート番号、対応API、モデル、セキュリティ設定はツールごとに違うため、まずはlocalhostで小さく試すのが安全です。
導入前に確認すること
- Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
- 最初は軽量モデル、短い質問、少ない同時作業から始める
- 公式サイトの対応OS、利用規約、モデルのライセンスを確認する
Hermes Desktopでつながらない時の読み順
Hermes Desktopの設定を何度も変える前に、症状別ハブで provider 側、base URL、model ID、API key、PC負荷を分けて確認してください。
- Hermes Desktopトラブル解決ハブ - connection refused、model not found、401/429、timeout、WSL2を症状別に切り分ける
- Hermes Desktop接続トラブル診断 - 数問選んで最初に疑う原因と読む記事を確認する
ローカルAIをAPIで使うとは
APIは、別のアプリやコードからAIに指示を送る窓口です。チャット画面に文章を入力する代わりに、Python、JavaScript、自作ツール、ノートアプリ、RAGツールなどからローカルAIへリクエストを送ります。
ローカルAI APIを使うと、文章の下書き、要約、分類、翻訳、メモ整理、個人開発アプリへのAI機能追加などに進めます。ただし、APIで呼び出してもモデルが重ければ遅く、モデルサイズ、量子化、コンテキスト長、メモリ、VRAMの影響は残ります。
APIサーバーとは何か
APIサーバーとは、別のアプリからのリクエストを待ち受ける小さな窓口です。LM StudioやJanのデスクトップアプリ、Ollamaのような常駐プロセスを起動し、そこへコードや別ツールから接続します。
初心者は外部公開やLAN公開を急がず、自分のPC内だけで動くlocalhostから始めてください。localhostは「自分のPC自身」を指す住所のようなもので、最初の検証では外部へ開けないほうが安全です。
OpenAI互換APIとは何か
OpenAI互換APIは、OpenAI向けに作られたコードやツールを、ローカルAIのサーバーへ向け替えられる可能性がある仕組みです。たとえばbase URLをOpenAIではなくlocalhostのアドレスに変えることで、同じような形でチャット補完を呼び出せる場合があります。
ただし、完全互換ではありません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込み、レスポンス形式はツールやバージョンごとに異なります。「OpenAI互換だから何でも同じ」と考えず、使う機能ごとに公式ドキュメントを確認してください。
LM Studio / Ollama / Jan のAPI比較表
| ツール | APIの使いやすさ | OpenAI互換API | GUIの有無 | 初心者向け度 | 向いている用途 | 注意点 |
|---|---|---|---|---|---|---|
| LM Studio | GUIから始めやすい | 対応範囲あり | あり | 高め | ローカルモデルを起動し、localhostのAPIとして試す | ポートやサーバー起動状態、モデル読み込みを確認する |
| Ollama | コマンドに慣れると扱いやすい | 対応範囲あり | 基本はコマンド/API | 中くらい | 開発、常駐API、他ツール連携 | モデル名、コンテキスト設定、対応APIの違いを確認する |
| Jan | アプリ内設定を確認して使う | 対応範囲あり | あり | 中くらい | 自分用AIアプリ、ローカルAPI、外部API比較 | ローカル利用とクラウド/API接続でプライバシー前提が変わる |
LM StudioのAPIでできること
LM StudioはローカルLLM APIサーバーとして使える機能があり、公式ドキュメントではREST API、SDK、OpenAI互換エンドポイントが案内されています。例ではlocalhostのポートを指定して呼び出す形が示されていますが、実際のポート番号やUI名は設定で変わる場合があります。
LM StudioはGUIでモデルを選び、読み込んでからAPIとして試しやすい点が入口になります。まず短い質問でモデル単体の速度を確認し、そのあとAPI呼び出しへ進むと原因を切り分けやすくなります。
OllamaのAPIでできること
OllamaはAPIやOpenAI互換APIを使った連携に向きます。公式ドキュメントではデフォルトのlocalhost API、Python/JavaScriptライブラリ、OpenAI互換のbase URLが案内されています。
コマンド操作に抵抗がない人なら、Ollamaは個人開発や自動化の土台にしやすいです。一方で、完全初心者はモデル名、実行状態、コンテキスト設定、停止方法を混同しやすいので、まず単体のチャット動作を確認してください。
JanのローカルAPIサーバーでできること
Janの公式APIドキュメントでは、OpenAI互換APIとしてローカルAPIサーバーやJan Serverの情報が案内されています。ローカルアプリとして使う場合と、外部APIやクラウドAIを接続する場合で、データ送信やプライバシーの前提が変わります。
JanはLM Studioの次に比較したい人、自分用AI環境を作りたい人、API連携も見たい人に向きます。APIだけで判断せず、ローカル実行なのか外部接続なのかを分けて確認してください。
クラウドAPIとローカルAI APIの比較表
| 比較軸 | クラウドAPI | ローカルAI API |
|---|---|---|
| 料金 | 従量課金やプラン料金が必要になりやすい | API呼び出し自体はローカルだが、PC購入や電気代、モデル保存容量が必要 |
| 速度 | ネットワークと提供側の性能に依存 | PC性能、モデルサイズ、量子化、VRAMに依存 |
| セットアップ | APIキーとSDKで始めやすい場合が多い | モデル、ツール、サーバー起動、ポート確認が必要 |
| プライバシー | 入力データが外部サービスへ送信される | localhostだけならPC内中心だが、外部API連携やLAN公開では前提が変わる |
| モデル選択 | 提供モデルから選ぶ | GGUFやOllamaモデルなどを自分で選ぶ |
| PC負荷 | 手元PCの負荷は少なめ | CPU、メモリ、GPU、VRAMを使う |
| 安定性 | 提供側の仕様変更や制限を受ける | 手元環境の設定、発熱、メモリ不足の影響を受ける |
PythonやJavaScriptから呼び出すと何ができるか
短いスクリプトから文章の要約、分類、下書き、ファイル名の整理、ログの読み取り補助などを試せます。コード例を使う場合は、まずlocalhostの短いテストに限定し、APIキーや秘密情報を外部へ送らない形にしてください。
既存のOpenAI向けコードを流用する場合でも、base URL、モデル名、対応パラメータをローカルツールに合わせる必要があります。動かないときは、コードより先にAPIサーバーが起動しているか、モデルが読み込まれているかを確認します。
APIで使うときに必要なPCスペック
APIで呼び出すから軽くなるわけではありません。実際には同じモデルを動かしているため、モデルサイズ、Q4/Q5/Q8、コンテキスト長、CPU、GPU、VRAM、同時起動アプリが関係します。
- ローカルAIのモデルサイズ早見表 - 8GB、16GB、32GBで最初に選ぶモデルサイズを確認する
- コンテキスト長とは - 長文や会話履歴でAPIが重くなる理由を確認する
- GPUオフロードとは - LM StudioでCPU/GPU/VRAMを見るポイントを確認する
セキュリティで注意すること
外部公開やLAN公開を安易に勧めません。最初はlocalhostだけで動かし、必要が出た場合だけ、認証、ファイアウォール、CORS、接続元、ログ、入力データの扱いを確認してください。
クラウドAPIや外部APIへ接続する場合は、入力した文章やファイルの一部が外部へ送信される可能性があります。社内文書、顧客情報、個人情報、秘密情報を扱う前に、公式情報、利用規約、会社や案件のルールを確認してください。
初心者はどこから始めるべきか
最初はLM StudioまたはOllamaで軽いモデルを1つ動かし、短い日本語質問に答えられるか確認します。次にlocalhostのAPIへ短いリクエストを送り、最後に自分のスクリプトやツールへつなげる順番が安全です。
- LM Studioの基本情報 - GUIでモデルを起動してからAPIへ進む
- Ollamaの基本情報 - コマンド/API連携を前提に使う入口を確認する
- Janとは - ローカルAIと外部APIを1つの画面で扱う選択肢を確認する
次に読む記事
- コンテキスト長とは - APIで長文や会話履歴を扱う前に読む
- ローカルAIでJSON出力する方法 - APIの回答をプログラムで扱いやすい形にする
- MCPとは - AIに外部ツールを使わせる仕組みと注意点を見る
- RAG・埋め込み・ベクトルDBの仕組み - PDFや文書チャットをAPIと組み合わせる前に読む
- GPUオフロードとは - LM Studio APIが遅いときのPC側確認に進む
- Q4/Q5/Q8の違い - APIで使うモデルの軽さと品質を確認する
よくある質問
ローカルAI APIは無料で使えますか?
localhostで動かすローカルAI APIの呼び出し自体は、クラウドAPIのような従量課金ではない場合が多いです。ただし、PC本体、GPU、電気代、保存容量、使うモデルや連携サービスの条件は別に確認が必要です。
OpenAI互換APIならOpenAIと完全に同じですか?
完全に同じとは限りません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込みなどはLM Studio、Ollama、Janごとに違います。
外部にデータは送信されますか?
localhostだけでローカルモデルを使う場合と、クラウドAIや外部APIに接続する場合で前提が変わります。LAN公開や外部API接続を使う前に設定と公式情報を確認してください。
Pythonが分からなくても使う意味はありますか?
あります。APIの考え方を知っておくと、AnythingLLM、Jan、Ollama、個人開発ツールがどのようにAIへ接続しているか理解しやすくなります。
APIで呼び出せば速くなりますか?
APIにしても同じモデルを動かすため、必ず速くなるわけではありません。モデルサイズ、量子化、コンテキスト長、メモリ、VRAM、CPU/GPUが関係します。
ポート番号は1234や1337で固定ですか?
固定とは限りません。公式例やデフォルトとして示されることはありますが、ツールや設定、バージョンで変わる可能性があります。実際の画面や公式ドキュメントで確認してください。
次に読むおすすめルート
開発・API連携したい人
LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
- ローカルAIでJSON出力する方法
- LM StudioとOllamaの違い
- コンテキスト長とは
- RAG・埋め込み・ベクトルDBの仕組み
- RAG評価と引用確認の基礎
- faithfulness確認
- ローカルRAGのプライバシー
- MCPとは
- ローカルLLMの安全性とプライバシー
- Gemma 4 12Bの更新メモ
- Hermes Desktopとは
- Hermes DesktopとLM Studio接続
- Hermes DesktopとOllama接続
- Hermes Desktop接続トラブル
- Hermes DesktopでOpenRouterを使う
- Hermes DesktopでDeepSeek APIを使う
- Hermes DesktopでProviderを使い分ける
- Hermes DesktopとLM Studio接続の確認ポイント
- Hermes AgentとDesktopの違い
- Ollamaとは
- Ollamaの解説
- 診断基準
- 比較表
あなたはどのタイプ?
- 初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
- PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
- 開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
関連チェック先
- LM Studio API / Developer Docs - LM StudioのSDK、REST API、OpenAI互換API、ローカルサーバー機能を確認できます。
- LM Studio Local Server - LM StudioのローカルLLM APIサーバー、localhostやネットワーク公開、起動方法を確認できます。
- LM Studio OpenAI Compatibility API - LM StudioのOpenAI互換エンドポイント、base URL、対応範囲を確認できます。
- Ollama API - OllamaのAPI、デフォルトのlocalhost、Python/JavaScriptライブラリを確認できます。
- Ollama OpenAI Compatibility - OllamaのOpenAI互換API、対応範囲、base URL、注意点を確認できます。
- Jan API Documentation - JanのOpenAI互換API、ローカルAPIサーバー、Jan Serverの概要を確認できます。