WindowsでローカルAIを始める完全ガイド

公開日: 2026-05-28
更新日: 2026-05-28
情報確認日: 2026-05-28

WindowsでローカルAIを始めたいけど、LM Studio・Ollama・GGUF・AnythingLLMの違いで止まる人向けの入口です。まず何を選ぶか、どのモデルサイズから試すか、手元のPCで無理が少ない始め方を整理します。

自分のPCで何から始めるか確認する

メモリ、GPUの有無、目的、コマンド操作への慣れから、LM Studio、Ollama、軽量モデル、文書活用のどこから始めるかを確認できます。

4つの入口

ローカルLLMの全体像から知りたい - ローカルLLM入門: ChatGPTとの違い、できること、必要スペック、最初のツール選びをまとめて確認します。
まず試したい - LM Studio: 画面操作でモデルを探し、短い日本語チャットから始めやすい入口です。
コマンドで管理したい - Ollama: API連携や開発用途まで考える人に向く、裏側の実行環境です。
PDFやメモを使いたい - AnythingLLM: 文書やナレッジベースをAIチャットとつなぐ作業場として使います。
モデルファイル選びで迷う - GGUFガイド: Q4/Q5/Q8、7B/8B、ファイルサイズの見方を先に確認します。
中古PCを買う前に確認 - PC購入前チェッカー: LM Studio用にメモリ、GPU、VRAM、ストレージの見落としを減らします。

まず何を選べばいいか

やりたいこと	向いている選択肢	理由
とにかくローカルAIを試したい	LM Studio	GUIで始めやすく、モデル検索からチャットまでの流れが見えやすい
コマンドやAPIで使いたい	Ollama	開発、連携、他ツールとの組み合わせに向く
PDFやメモを読み込ませたい	AnythingLLM	ナレッジベース用途に向き、文書を参照するチャットを作りやすい
モデルファイル選びで迷っている	GGUFガイド	Q4/Q5/Q8やモデルサイズを分けて整理できる
中古PCで動くか知りたい	モデルサイズガイド / 中古PCチェック	メモリ、CPU、GPU、ストレージの目安が必要

ローカルAIで迷いやすいポイント

GGUFは、LM Studioなどで扱うローカルAIモデルのファイル形式のひとつです。Q4、Q5、Q8は量子化の目安で、Q4は軽め、Q5は少し品質寄り、Q8は重くなりやすい候補として見ます。

7B、8B、14B、27Bのような表記はモデル規模の目安です。数字が大きいほど賢そうに見えますが、メモリ、VRAM、保存容量、待ち時間も増えやすくなります。

LM Studioは画面操作で始めやすい入口、OllamaはコマンドやAPI連携に向く実行環境、AnythingLLMはPDFやメモなどの知識ベースとチャットをつなぐ作業場、と分けて考えると迷いにくくなります。

メモリ別の目安

PCメモリ	目安	初心者向けコメント
8GB	軽量モデル中心	大きいモデルは避けた方が安全。短いチャットで動作確認する目安です。
16GB	7B〜8B級の軽量量子化が現実的	まず試すならこのあたり。Q4/Q5前後から始めると切り分けやすいです。
32GB	選択肢が広がる	複数ツール連携や少し長めの文章にも進みやすくなります。
64GB以上	大きめのモデルも試しやすい	ただし速度はCPU/GPUにも左右されます。最初は軽めで基準を作ると安全です。

最初に避けたいこと

8GBメモリで大きいモデルや長いPDF処理から始める
Q8や14B以上を高性能そうという理由だけで最初に選ぶ
中古PC購入前にメモリ増設可否、SSD空き容量、CPU世代、GPU/VRAMを確認しない

次に読むべきページ

ChatGPT・Gemini・Claudeが進化してもローカルAIは必要？ - クラウドAIとLM Studio/Ollama/GGUFの使い分けを先に整理
LM Studioで最初に選ぶモデル - 最初のGGUFモデル、Q4/Q5、7B/8Bの選び方を確認
ローカルAI更新メモ - 新しいモデルやツール更新を公開時点の情報として確認
Gemma 4 12Bの更新メモ - 12B級モデルを試す前の確認ポイントを整理
Hermes Desktopとは？ - LM Studioに慣れた後のエージェント環境を検証前に整理
Hermes DesktopとLM Studioの違い - LM Studioをエンジン側、Hermes Desktopを操縦席側として整理
Hermes DesktopでLM Studioにつながらない時の確認ポイント - port 1234、base URL、model IDを順番に確認
Hermes DesktopとOllama - Ollamaをモデルプロバイダーにする場合の考え方を確認
Hermes AgentとHermes Desktopの違い - GUI、本体、LM Studio/Ollamaの関係を整理
Qwen3.5とQwen3.6はどっちを選ぶ？ - 最新モデル名、MTP、Heretic、GGUFで迷う人向け
GGUFとは？LM Studioで迷うQ4/Q5・7B/8Bの選び方 - Hugging FaceやLM Studioで .gguf、Q4_K_M、7B/8Bを見て迷う人向け
Hugging FaceでGGUFモデルを探す方法 - モデルカード、ライセンス、ファイル名、量子化の見方を確認
ローカルLLMツール比較 - LM Studio、Ollama、Jan、AnythingLLMの違いを目的別に確認
ローカルLLMの安全性とプライバシー - 外部送信、履歴、RAG、MCP、モデルの出所を確認
AnythingLLMとは？WindowsでローカルAI知識ベースを作る手順とLM Studio接続方法 - PDFやメモをAIで使いたい人向け
ローカルAIでよくあるエラー集 - 重い、動かない、接続できないときの確認先
ローカルAIのモデルサイズ早見表 - 8GB・16GB・32GBで何を選ぶかの目安
ローカルAIをAPIで使うには？ - LM Studio・Ollama・JanをAPIサーバーとして使う入口
ローカルAIでJSON出力するには？ - APIの回答を分類や診断結果として扱いやすくする
コンテキスト長とは？ - 長文・PDF・会話履歴が重くなる理由を確認
PDF・文書チャットの使い分け - LM Studio、AnythingLLM、RAGの違いを確認
RAG・埋め込み・ベクトルDBとは？ - PDFチャットの裏側で起きていることを理解
埋め込みモデルとは？ - 意味検索やRAGで使うモデルの役割を確認
MCPとは？ - ローカルAIにツールを使わせる仕組みと注意点を理解
GPUオフロードとは？ - LM StudioでCPUばかり使われる時の確認ポイント
LM StudioとOllamaの違い - GUIで始めるか、コマンド/APIで進めるかを比較
GPUなしPCでローカルAIは使える？ - GPUなし、内蔵GPU、CPU実行の現実ラインを確認
LM Studio用PC購入前チェッカー - 中古PCやミニPCを買う前に用途別の目安を確認
中古PCでローカルAIは使える？ - 購入前にメモリ、ストレージ、GPU、冷却を見る
AnythingLLMでPDFを読むには？商用利用前の確認も整理 - PDFや資料をローカルAIで扱う前の準備
LM Studioで迷うQ4・Q5・Q8の選び方 - GGUF量子化モデルをメモリ別に選ぶ目安を確認