LM Studioで最初に選ぶモデルは?7B・8B・Q4_K_Mの選び方

公開日
2026-05-19
更新日
2026-06-28
情報確認日
2026-06-28

最初の1本は「最も賢そうな最大モデル」ではなく、PCで安定して動き、比較の基準にできるモデルを選びます。迷ったら、Instruct向けの7B/8B級GGUF、Q4_K_M前後を候補にし、短い日本語質問から試してください。

導入前に確認すること

  • Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
  • 最初は軽量モデル、短い質問、少ない同時作業から始める
  • 公式サイトの対応OS、利用規約、モデルのライセンスを確認する

最初のモデルは「軽さ」と「出所」を両方見る

LM Studioで最初に選ぶモデルは、PCに合う軽さだけでなく、Model Card、配布者、元モデル、licenseも確認します。知らないGGUFを試す時は、個人情報やAPIキーを入力しない短い質問から始めます。

最初の1本は研究ベンチより体感確認を優先する

最初から大きいQ8や長文PDFを試すと、モデル選びとPC負荷の問題が混ざります。小型モデル、Q4/Q5、短い日本語質問から始めると、自分のPCでの現実が見えます。

  1. 7B/8B級または軽量モデルを1つ選ぶ
  2. Model Card、license、base model、intended useを見る
  3. 短い日本語質問を3つ試す
  4. 速度とPC負荷をメモする
  5. 必要になってからQ5/Q8や別モデルを比較する

ファイル名で見る順番

  1. InstructまたはChatかを見て、会話用途に調整された候補を選びます。
  2. 7B/8Bなどモデル規模を見て、まずPCに無理のない大きさへ絞ります。
  3. Q4_K_Mを基準にし、余裕が確認できてからQ5_K_Mを比較します。
  4. GGUFであること、配布者、README、ライセンス、必要なチャットテンプレートを確認します。
  5. 短い日本語質問、要約、箇条書きの3種類で試し、期待だけで巨大モデルへ移らないようにします。

日本語性能はモデル名やサイズだけでは決まりません。学習・調整内容、プロンプト、量子化、用途で変わるため、まず7B/8B Q4_K_M級で動作と回答傾向を確認し、足りない点を言語化してから次を選びます。

最初の1本を選ぶ5条件

条件見る表示理由
形式GGUFLM Studioで扱う候補を絞る
用途Instruct / Chat質問への回答に向くモデルを選ぶ
規模7B / 8B級初心者が速度と品質を比較しやすい
量子化Q4_K_M前後メモリと品質のバランスを取りやすい
情報モデルカード・ライセンス用途、言語、配布条件を確認する

PCスペック別の開始目安

PC開始候補注意
メモリ8GBより小さいモデルの軽いQ4OS分の余裕が少なく、7B/8Bでも厳しい場合がある
メモリ16GB7B/8B級Q4_K_M前後ブラウザ等を閉じ、短い入力から
メモリ32GB7B/8Bを基準に13B/14B級も比較長いコンテキストは別に負荷が増える
GPUなし軽いモデルをCPUで確認応答速度は控えめに見積もる

LM Studioで選ぶ順番

  1. モデル名より先に、モデルカードと用途を読む。
  2. GGUFの中からInstructまたはChat向けを選ぶ。
  3. 7B/8B級、Q4_K_M前後、PCに収まるファイル容量へ絞る。
  4. ロード後に「日本語で3行に要約して」など短い質問を試す。
  5. 速度、メモリ、回答品質を記録し、次にQ5や別モデルを比較する。

最初のテスト質問

  • 「自己紹介を日本語で3文にまとめてください」
  • 「次の文章を3つの箇条書きで要約してください」
  • 「分からない場合は推測せず、分からないと答えてください」
  • 同じ質問を2回送り、速度と回答の安定性を見る。

うまく動かない時の戻り方

ロードできない 小さいモデル/Q4へ

モデル規模とファイル容量を下げます。

極端に遅い コンテキストとGPU確認

短い入力へ戻し、GPUオフロードを確認します。

日本語が弱い モデルカードを比較

日本語例やInstruct用途を確認し、別モデルを試します。

次に読む記事

よくある質問

LM Studioで最初におすすめのモデル名はありますか?

モデルは更新が早いため、固定名で強くすすめるより、7B/8B級、GGUF、Q4/Q5、ファイルサイズを見て軽いものから試すのが安全です。

Q4とQ5はどちらを選べばよいですか?

PCスペックに不安があるならQ4から、16GB以上で少し余裕を見たいならQ5も候補です。まずは動く範囲を確認しましょう。

日本語モデルだけを選べば大丈夫ですか?

日本語対応の説明は参考になりますが、実際の自然さは試して確認する必要があります。同じ短い質問で比較すると判断しやすいです。

LM Studioで最初に選ぶモデルは7Bと8Bのどちらですか?

数字だけで決める必要はありません。7B/8B級のInstructモデルから、GGUFのQ4_K_M前後でPCに収まるものを選び、モデルカードの日本語用途やライセンスも確認してください。

最初からQ5やQ8を選んでもよいですか?

PCに余裕があれば比較できますが、最初はQ4_K_M前後で動作基準を作る方が、ロード失敗や極端な遅さを避けやすいです。安定後にQ5を比較してください。

BaseモデルとInstructモデルのどちらを選びますか?

最初のチャットや質問回答にはInstructまたはChat向けが分かりやすいです。Baseモデルは追加調整や別用途を前提にすることがあり、初心者の最初の1本には向かない場合があります。

次に読むおすすめルート

初めてローカルAIを触る人

まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。

  1. クラウドAIとローカルAIの使い分け
  2. ローカルLLMとは
  3. ローカルAIを入れる前に確認すること
  4. WindowsでローカルAIを始める完全ガイド
  5. LM Studioとは
  6. GGUFとは
  7. 小型LLM・量子化の現実
  8. GGUF量子化安全とRAG/NPU研究
  9. Hugging Face安全チェック
  10. PDF/RAG/引用確認の現実
  11. GGUFモデル選び診断
  12. Hugging FaceでGGUFモデルを探す方法
  13. Q4/Q5/Q8の違いと選び方
  14. Q4/Q5/Q8研究ガイド
  15. Hermes Desktopとは
  16. Hermes DesktopとLM Studio接続
  17. Hermes DesktopとOllama接続
  18. Hermes Desktop接続トラブル
  19. Hermes AgentとDesktopの違い
  20. ローカルLLMツール比較
  21. ローカルAI更新メモ
  22. 診断ページ

あなたはどのタイプ?

関連チェック先

  • Local AI Compass 診断 - 手元のPCスペックや目的から、最初に試す構成の目安を確認できます。
  • LM Studio Docs - LM Studioのアプリ、ローカルモデル、モデル管理の公式入口です。
  • Hugging Face Models - モデルカード、ライセンス、配布元、intended useを確認する入口です。
  • Hugging Face Model Cards - model cardでintended use、limitations、licenseなどを確認するための公式説明です。

関連ツール

比較表を見る / 最初に検討しやすいツールを確認する