LM Studioで最初に選ぶモデルは?7B・8B・Q4_K_Mの選び方
- 公開日
- 2026-05-19
- 更新日
- 2026-06-28
- 情報確認日
- 2026-06-28
最初の1本は「最も賢そうな最大モデル」ではなく、PCで安定して動き、比較の基準にできるモデルを選びます。迷ったら、Instruct向けの7B/8B級GGUF、Q4_K_M前後を候補にし、短い日本語質問から試してください。
導入前に確認すること
- Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
- 最初は軽量モデル、短い質問、少ない同時作業から始める
- 公式サイトの対応OS、利用規約、モデルのライセンスを確認する
最初のモデルは「軽さ」と「出所」を両方見る
LM Studioで最初に選ぶモデルは、PCに合う軽さだけでなく、Model Card、配布者、元モデル、licenseも確認します。知らないGGUFを試す時は、個人情報やAPIキーを入力しない短い質問から始めます。
- ローカルAIモデル安全研究ガイド - GGUF量子化安全とRAG/NPUをまとめて読む
- GGUF量子化安全の基礎 - Q4/Q5/Q8と安全性を分ける
- Hugging Face安全チェック - model card、license、配布元を見る
最初の1本は研究ベンチより体感確認を優先する
最初から大きいQ8や長文PDFを試すと、モデル選びとPC負荷の問題が混ざります。小型モデル、Q4/Q5、短い日本語質問から始めると、自分のPCでの現実が見えます。
- 7B/8B級または軽量モデルを1つ選ぶ
- Model Card、license、base model、intended useを見る
- 短い日本語質問を3つ試す
- 速度とPC負荷をメモする
- 必要になってからQ5/Q8や別モデルを比較する
- 小型LLM研究ガイド - 速度・メモリ・精度・電力・プライバシーをまとめて確認する
- Q4/Q5/Q8研究ガイド - 量子化の犠牲と選び方を深く読む
- GGUFモデル選び診断 - PC条件から最初の量子化モデルを絞る
ファイル名で見る順番
- InstructまたはChatかを見て、会話用途に調整された候補を選びます。
- 7B/8Bなどモデル規模を見て、まずPCに無理のない大きさへ絞ります。
- Q4_K_Mを基準にし、余裕が確認できてからQ5_K_Mを比較します。
- GGUFであること、配布者、README、ライセンス、必要なチャットテンプレートを確認します。
- 短い日本語質問、要約、箇条書きの3種類で試し、期待だけで巨大モデルへ移らないようにします。
日本語性能はモデル名やサイズだけでは決まりません。学習・調整内容、プロンプト、量子化、用途で変わるため、まず7B/8B Q4_K_M級で動作と回答傾向を確認し、足りない点を言語化してから次を選びます。
最初の1本を選ぶ5条件
| 条件 | 見る表示 | 理由 |
|---|---|---|
| 形式 | GGUF | LM Studioで扱う候補を絞る |
| 用途 | Instruct / Chat | 質問への回答に向くモデルを選ぶ |
| 規模 | 7B / 8B級 | 初心者が速度と品質を比較しやすい |
| 量子化 | Q4_K_M前後 | メモリと品質のバランスを取りやすい |
| 情報 | モデルカード・ライセンス | 用途、言語、配布条件を確認する |
PCスペック別の開始目安
| PC | 開始候補 | 注意 |
|---|---|---|
| メモリ8GB | より小さいモデルの軽いQ4 | OS分の余裕が少なく、7B/8Bでも厳しい場合がある |
| メモリ16GB | 7B/8B級Q4_K_M前後 | ブラウザ等を閉じ、短い入力から |
| メモリ32GB | 7B/8Bを基準に13B/14B級も比較 | 長いコンテキストは別に負荷が増える |
| GPUなし | 軽いモデルをCPUで確認 | 応答速度は控えめに見積もる |
LM Studioで選ぶ順番
- モデル名より先に、モデルカードと用途を読む。
- GGUFの中からInstructまたはChat向けを選ぶ。
- 7B/8B級、Q4_K_M前後、PCに収まるファイル容量へ絞る。
- ロード後に「日本語で3行に要約して」など短い質問を試す。
- 速度、メモリ、回答品質を記録し、次にQ5や別モデルを比較する。
最初のテスト質問
- 「自己紹介を日本語で3文にまとめてください」
- 「次の文章を3つの箇条書きで要約してください」
- 「分からない場合は推測せず、分からないと答えてください」
- 同じ質問を2回送り、速度と回答の安定性を見る。
うまく動かない時の戻り方
モデル規模とファイル容量を下げます。
短い入力へ戻し、GPUオフロードを確認します。
日本語例やInstruct用途を確認し、別モデルを試します。
次に読む記事
- GGUFとは - ファイル形式と表示の意味を確認する
- Q4・Q5・Q8の違い - 量子化を比較する
- モデルサイズ早見表 - PCメモリ別の範囲を見る
- GPUオフロードとは - CPUだけ使われる時に確認する
よくある質問
LM Studioで最初におすすめのモデル名はありますか?
モデルは更新が早いため、固定名で強くすすめるより、7B/8B級、GGUF、Q4/Q5、ファイルサイズを見て軽いものから試すのが安全です。
Q4とQ5はどちらを選べばよいですか?
PCスペックに不安があるならQ4から、16GB以上で少し余裕を見たいならQ5も候補です。まずは動く範囲を確認しましょう。
日本語モデルだけを選べば大丈夫ですか?
日本語対応の説明は参考になりますが、実際の自然さは試して確認する必要があります。同じ短い質問で比較すると判断しやすいです。
LM Studioで最初に選ぶモデルは7Bと8Bのどちらですか?
数字だけで決める必要はありません。7B/8B級のInstructモデルから、GGUFのQ4_K_M前後でPCに収まるものを選び、モデルカードの日本語用途やライセンスも確認してください。
最初からQ5やQ8を選んでもよいですか?
PCに余裕があれば比較できますが、最初はQ4_K_M前後で動作基準を作る方が、ロード失敗や極端な遅さを避けやすいです。安定後にQ5を比較してください。
BaseモデルとInstructモデルのどちらを選びますか?
最初のチャットや質問回答にはInstructまたはChat向けが分かりやすいです。Baseモデルは追加調整や別用途を前提にすることがあり、初心者の最初の1本には向かない場合があります。
次に読むおすすめルート
初めてローカルAIを触る人
まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- クラウドAIとローカルAIの使い分け
- ローカルLLMとは
- ローカルAIを入れる前に確認すること
- WindowsでローカルAIを始める完全ガイド
- LM Studioとは
- GGUFとは
- 小型LLM・量子化の現実
- GGUF量子化安全とRAG/NPU研究
- Hugging Face安全チェック
- PDF/RAG/引用確認の現実
- GGUFモデル選び診断
- Hugging FaceでGGUFモデルを探す方法
- Q4/Q5/Q8の違いと選び方
- Q4/Q5/Q8研究ガイド
- Hermes Desktopとは
- Hermes DesktopとLM Studio接続
- Hermes DesktopとOllama接続
- Hermes Desktop接続トラブル
- Hermes AgentとDesktopの違い
- ローカルLLMツール比較
- ローカルAI更新メモ
- 診断ページ
あなたはどのタイプ?
- 初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
- PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
- 開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
関連チェック先
- Local AI Compass 診断 - 手元のPCスペックや目的から、最初に試す構成の目安を確認できます。
- LM Studio Docs - LM Studioのアプリ、ローカルモデル、モデル管理の公式入口です。
- Hugging Face Models - モデルカード、ライセンス、配布元、intended useを確認する入口です。
- Hugging Face Model Cards - model cardでintended use、limitations、licenseなどを確認するための公式説明です。