ローカルAIをAPIで使うには？LM Studio・Ollama・JanのOpenAI互換APIを初心者向けに解説

公開日: 2026-06-06
更新日: 2026-06-20
情報確認日: 2026-06-06

ローカルAIは、チャット画面で使うだけでなく、APIサーバーとして動かして自分のアプリやスクリプトから呼び出せます。LM Studio、Ollama、JanにはOpenAI互換APIとして使える機能があり、既存のOpenAI向けコードを一部変更して使える場合があります。ただし、ポート番号、対応API、モデル、セキュリティ設定はツールごとに違うため、まずはlocalhostで小さく試すのが安全です。

導入前に確認すること

Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
最初は軽量モデル、短い質問、少ない同時作業から始める
公式サイトの対応OS、利用規約、モデルのライセンスを確認する

Hermes Desktopでつながらない時の読み順

Hermes Desktopの設定を何度も変える前に、症状別ハブで provider 側、base URL、model ID、API key、PC負荷を分けて確認してください。

Hermes Desktopトラブル解決ハブ - connection refused、model not found、401/429、timeout、WSL2を症状別に切り分ける
Hermes Desktop接続トラブル診断 - 数問選んで最初に疑う原因と読む記事を確認する

ローカルAIをAPIで使うとは

APIは、別のアプリやコードからAIに指示を送る窓口です。チャット画面に文章を入力する代わりに、Python、JavaScript、自作ツール、ノートアプリ、RAGツールなどからローカルAIへリクエストを送ります。

ローカルAI APIを使うと、文章の下書き、要約、分類、翻訳、メモ整理、個人開発アプリへのAI機能追加などに進めます。ただし、APIで呼び出してもモデルが重ければ遅く、モデルサイズ、量子化、コンテキスト長、メモリ、VRAMの影響は残ります。

APIサーバーとは何か

APIサーバーとは、別のアプリからのリクエストを待ち受ける小さな窓口です。LM StudioやJanのデスクトップアプリ、Ollamaのような常駐プロセスを起動し、そこへコードや別ツールから接続します。

初心者は外部公開やLAN公開を急がず、自分のPC内だけで動くlocalhostから始めてください。localhostは「自分のPC自身」を指す住所のようなもので、最初の検証では外部へ開けないほうが安全です。

OpenAI互換APIとは何か

OpenAI互換APIは、OpenAI向けに作られたコードやツールを、ローカルAIのサーバーへ向け替えられる可能性がある仕組みです。たとえばbase URLをOpenAIではなくlocalhostのアドレスに変えることで、同じような形でチャット補完を呼び出せる場合があります。

ただし、完全互換ではありません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込み、レスポンス形式はツールやバージョンごとに異なります。「OpenAI互換だから何でも同じ」と考えず、使う機能ごとに公式ドキュメントを確認してください。

LM Studio / Ollama / Jan のAPI比較表

ツール	APIの使いやすさ	OpenAI互換API	GUIの有無	初心者向け度	向いている用途	注意点
LM Studio	GUIから始めやすい	対応範囲あり	あり	高め	ローカルモデルを起動し、localhostのAPIとして試す	ポートやサーバー起動状態、モデル読み込みを確認する
Ollama	コマンドに慣れると扱いやすい	対応範囲あり	基本はコマンド/API	中くらい	開発、常駐API、他ツール連携	モデル名、コンテキスト設定、対応APIの違いを確認する
Jan	アプリ内設定を確認して使う	対応範囲あり	あり	中くらい	自分用AIアプリ、ローカルAPI、外部API比較	ローカル利用とクラウド/API接続でプライバシー前提が変わる

LM StudioのAPIでできること

LM StudioはローカルLLM APIサーバーとして使える機能があり、公式ドキュメントではREST API、SDK、OpenAI互換エンドポイントが案内されています。例ではlocalhostのポートを指定して呼び出す形が示されていますが、実際のポート番号やUI名は設定で変わる場合があります。

LM StudioはGUIでモデルを選び、読み込んでからAPIとして試しやすい点が入口になります。まず短い質問でモデル単体の速度を確認し、そのあとAPI呼び出しへ進むと原因を切り分けやすくなります。

OllamaのAPIでできること

OllamaはAPIやOpenAI互換APIを使った連携に向きます。公式ドキュメントではデフォルトのlocalhost API、Python/JavaScriptライブラリ、OpenAI互換のbase URLが案内されています。

コマンド操作に抵抗がない人なら、Ollamaは個人開発や自動化の土台にしやすいです。一方で、完全初心者はモデル名、実行状態、コンテキスト設定、停止方法を混同しやすいので、まず単体のチャット動作を確認してください。

JanのローカルAPIサーバーでできること

Janの公式APIドキュメントでは、OpenAI互換APIとしてローカルAPIサーバーやJan Serverの情報が案内されています。ローカルアプリとして使う場合と、外部APIやクラウドAIを接続する場合で、データ送信やプライバシーの前提が変わります。

JanはLM Studioの次に比較したい人、自分用AI環境を作りたい人、API連携も見たい人に向きます。APIだけで判断せず、ローカル実行なのか外部接続なのかを分けて確認してください。

クラウドAPIとローカルAI APIの比較表

比較軸	クラウドAPI	ローカルAI API
料金	従量課金やプラン料金が必要になりやすい	API呼び出し自体はローカルだが、PC購入や電気代、モデル保存容量が必要
速度	ネットワークと提供側の性能に依存	PC性能、モデルサイズ、量子化、VRAMに依存
セットアップ	APIキーとSDKで始めやすい場合が多い	モデル、ツール、サーバー起動、ポート確認が必要
プライバシー	入力データが外部サービスへ送信される	localhostだけならPC内中心だが、外部API連携やLAN公開では前提が変わる
モデル選択	提供モデルから選ぶ	GGUFやOllamaモデルなどを自分で選ぶ
PC負荷	手元PCの負荷は少なめ	CPU、メモリ、GPU、VRAMを使う
安定性	提供側の仕様変更や制限を受ける	手元環境の設定、発熱、メモリ不足の影響を受ける

PythonやJavaScriptから呼び出すと何ができるか

短いスクリプトから文章の要約、分類、下書き、ファイル名の整理、ログの読み取り補助などを試せます。コード例を使う場合は、まずlocalhostの短いテストに限定し、APIキーや秘密情報を外部へ送らない形にしてください。

既存のOpenAI向けコードを流用する場合でも、base URL、モデル名、対応パラメータをローカルツールに合わせる必要があります。動かないときは、コードより先にAPIサーバーが起動しているか、モデルが読み込まれているかを確認します。

APIで使うときに必要なPCスペック

APIで呼び出すから軽くなるわけではありません。実際には同じモデルを動かしているため、モデルサイズ、Q4/Q5/Q8、コンテキスト長、CPU、GPU、VRAM、同時起動アプリが関係します。

ローカルAIのモデルサイズ早見表 - 8GB、16GB、32GBで最初に選ぶモデルサイズを確認する
コンテキスト長とは - 長文や会話履歴でAPIが重くなる理由を確認する
GPUオフロードとは - LM StudioでCPU/GPU/VRAMを見るポイントを確認する

セキュリティで注意すること

外部公開やLAN公開を安易に勧めません。最初はlocalhostだけで動かし、必要が出た場合だけ、認証、ファイアウォール、CORS、接続元、ログ、入力データの扱いを確認してください。

クラウドAPIや外部APIへ接続する場合は、入力した文章やファイルの一部が外部へ送信される可能性があります。社内文書、顧客情報、個人情報、秘密情報を扱う前に、公式情報、利用規約、会社や案件のルールを確認してください。

初心者はどこから始めるべきか

最初はLM StudioまたはOllamaで軽いモデルを1つ動かし、短い日本語質問に答えられるか確認します。次にlocalhostのAPIへ短いリクエストを送り、最後に自分のスクリプトやツールへつなげる順番が安全です。

LM Studioの基本情報 - GUIでモデルを起動してからAPIへ進む
Ollamaの基本情報 - コマンド/API連携を前提に使う入口を確認する
Janとは - ローカルAIと外部APIを1つの画面で扱う選択肢を確認する

次に読む記事

コンテキスト長とは - APIで長文や会話履歴を扱う前に読む
ローカルAIでJSON出力する方法 - APIの回答をプログラムで扱いやすい形にする
MCPとは - AIに外部ツールを使わせる仕組みと注意点を見る
RAG・埋め込み・ベクトルDBの仕組み - PDFや文書チャットをAPIと組み合わせる前に読む
GPUオフロードとは - LM Studio APIが遅いときのPC側確認に進む
Q4/Q5/Q8の違い - APIで使うモデルの軽さと品質を確認する

よくある質問

ローカルAI APIは無料で使えますか？

localhostで動かすローカルAI APIの呼び出し自体は、クラウドAPIのような従量課金ではない場合が多いです。ただし、PC本体、GPU、電気代、保存容量、使うモデルや連携サービスの条件は別に確認が必要です。

OpenAI互換APIならOpenAIと完全に同じですか？

完全に同じとは限りません。対応エンドポイント、パラメータ、ストリーミング、ツール呼び出し、埋め込みなどはLM Studio、Ollama、Janごとに違います。

外部にデータは送信されますか？

localhostだけでローカルモデルを使う場合と、クラウドAIや外部APIに接続する場合で前提が変わります。LAN公開や外部API接続を使う前に設定と公式情報を確認してください。

Pythonが分からなくても使う意味はありますか？

あります。APIの考え方を知っておくと、AnythingLLM、Jan、Ollama、個人開発ツールがどのようにAIへ接続しているか理解しやすくなります。

APIで呼び出せば速くなりますか？

APIにしても同じモデルを動かすため、必ず速くなるわけではありません。モデルサイズ、量子化、コンテキスト長、メモリ、VRAM、CPU/GPUが関係します。

ポート番号は1234や1337で固定ですか？

固定とは限りません。公式例やデフォルトとして示されることはありますが、ツールや設定、バージョンで変わる可能性があります。実際の画面や公式ドキュメントで確認してください。

次に読むおすすめルート

開発・API連携したい人

LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。

あなたはどのタイプ？

初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。

ローカルAIをAPIで使うには？LM Studio・Ollama・JanのOpenAI互換APIを初心者向けに解説

導入前に確認すること

Hermes Desktopでつながらない時の読み順

ローカルAIをAPIで使うとは

APIサーバーとは何か

OpenAI互換APIとは何か

LM Studio / Ollama / Jan のAPI比較表

LM StudioのAPIでできること

OllamaのAPIでできること

JanのローカルAPIサーバーでできること

クラウドAPIとローカルAI APIの比較表

PythonやJavaScriptから呼び出すと何ができるか

APIで使うときに必要なPCスペック

セキュリティで注意すること

初心者はどこから始めるべきか

次に読む記事

よくある質問

ローカルAI APIは無料で使えますか？

OpenAI互換APIならOpenAIと完全に同じですか？

外部にデータは送信されますか？

Pythonが分からなくても使う意味はありますか？

APIで呼び出せば速くなりますか？

ポート番号は1234や1337で固定ですか？

次に読むおすすめルート

開発・API連携したい人

あなたはどのタイプ？

関連チェック先

関連ツール

ローカルAIをAPIで使うには？LM Studio・Ollama・JanのOpenAI互換APIを初心者向けに解説

導入前に確認すること

Hermes Desktopでつながらない時の読み順

ローカルAIをAPIで使うとは

APIサーバーとは何か

OpenAI互換APIとは何か

LM Studio / Ollama / Jan のAPI比較表

LM StudioのAPIでできること

OllamaのAPIでできること

JanのローカルAPIサーバーでできること

クラウドAPIとローカルAI APIの比較表

PythonやJavaScriptから呼び出すと何ができるか

APIで使うときに必要なPCスペック

セキュリティで注意すること

初心者はどこから始めるべきか

次に読む記事

よくある質問

ローカルAI APIは無料で使えますか？

OpenAI互換APIならOpenAIと完全に同じですか？

外部にデータは送信されますか？

Pythonが分からなくても使う意味はありますか？

APIで呼び出せば速くなりますか？

ポート番号は1234や1337で固定ですか？

次に読むおすすめルート

開発・API連携したい人

あなたはどのタイプ？

次に読むおすすめ記事

関連チェック先

関連ツール