LM Studioで最初に選ぶモデルは？7B・8B・Q4_K_Mの選び方

公開日: 2026-05-19
更新日: 2026-06-28
情報確認日: 2026-06-28

最初の1本は「最も賢そうな最大モデル」ではなく、PCで安定して動き、比較の基準にできるモデルを選びます。迷ったら、Instruct向けの7B/8B級GGUF、Q4_K_M前後を候補にし、短い日本語質問から試してください。

導入前に確認すること

Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
最初は軽量モデル、短い質問、少ない同時作業から始める
公式サイトの対応OS、利用規約、モデルのライセンスを確認する

最初のモデルは「軽さ」と「出所」を両方見る

LM Studioで最初に選ぶモデルは、PCに合う軽さだけでなく、Model Card、配布者、元モデル、licenseも確認します。知らないGGUFを試す時は、個人情報やAPIキーを入力しない短い質問から始めます。

ローカルAIモデル安全研究ガイド - GGUF量子化安全とRAG/NPUをまとめて読む
GGUF量子化安全の基礎 - Q4/Q5/Q8と安全性を分ける
Hugging Face安全チェック - model card、license、配布元を見る

最初の1本は研究ベンチより体感確認を優先する

最初から大きいQ8や長文PDFを試すと、モデル選びとPC負荷の問題が混ざります。小型モデル、Q4/Q5、短い日本語質問から始めると、自分のPCでの現実が見えます。

7B/8B級または軽量モデルを1つ選ぶ
Model Card、license、base model、intended useを見る
短い日本語質問を3つ試す
速度とPC負荷をメモする
必要になってからQ5/Q8や別モデルを比較する

小型LLM研究ガイド - 速度・メモリ・精度・電力・プライバシーをまとめて確認する
Q4/Q5/Q8研究ガイド - 量子化の犠牲と選び方を深く読む
GGUFモデル選び診断 - PC条件から最初の量子化モデルを絞る

ファイル名で見る順番

InstructまたはChatかを見て、会話用途に調整された候補を選びます。
7B/8Bなどモデル規模を見て、まずPCに無理のない大きさへ絞ります。
Q4_K_Mを基準にし、余裕が確認できてからQ5_K_Mを比較します。
GGUFであること、配布者、README、ライセンス、必要なチャットテンプレートを確認します。
短い日本語質問、要約、箇条書きの3種類で試し、期待だけで巨大モデルへ移らないようにします。

日本語性能はモデル名やサイズだけでは決まりません。学習・調整内容、プロンプト、量子化、用途で変わるため、まず7B/8B Q4_K_M級で動作と回答傾向を確認し、足りない点を言語化してから次を選びます。

最初の1本を選ぶ5条件

条件	見る表示	理由
形式	GGUF	LM Studioで扱う候補を絞る
用途	Instruct / Chat	質問への回答に向くモデルを選ぶ
規模	7B / 8B級	初心者が速度と品質を比較しやすい
量子化	Q4_K_M前後	メモリと品質のバランスを取りやすい
情報	モデルカード・ライセンス	用途、言語、配布条件を確認する

PCスペック別の開始目安

PC	開始候補	注意
メモリ8GB	より小さいモデルの軽いQ4	OS分の余裕が少なく、7B/8Bでも厳しい場合がある
メモリ16GB	7B/8B級Q4_K_M前後	ブラウザ等を閉じ、短い入力から
メモリ32GB	7B/8Bを基準に13B/14B級も比較	長いコンテキストは別に負荷が増える
GPUなし	軽いモデルをCPUで確認	応答速度は控えめに見積もる

LM Studioで選ぶ順番

モデル名より先に、モデルカードと用途を読む。
GGUFの中からInstructまたはChat向けを選ぶ。
7B/8B級、Q4_K_M前後、PCに収まるファイル容量へ絞る。
ロード後に「日本語で3行に要約して」など短い質問を試す。
速度、メモリ、回答品質を記録し、次にQ5や別モデルを比較する。

最初のテスト質問

「自己紹介を日本語で3文にまとめてください」
「次の文章を3つの箇条書きで要約してください」
「分からない場合は推測せず、分からないと答えてください」
同じ質問を2回送り、速度と回答の安定性を見る。

うまく動かない時の戻り方

ロードできない 小さいモデル/Q4へ

モデル規模とファイル容量を下げます。

極端に遅い コンテキストとGPU確認

短い入力へ戻し、GPUオフロードを確認します。

日本語が弱い モデルカードを比較

日本語例やInstruct用途を確認し、別モデルを試します。

次に読む記事

GGUFとは - ファイル形式と表示の意味を確認する
Q4・Q5・Q8の違い - 量子化を比較する
モデルサイズ早見表 - PCメモリ別の範囲を見る
GPUオフロードとは - CPUだけ使われる時に確認する

よくある質問

LM Studioで最初におすすめのモデル名はありますか？

モデルは更新が早いため、固定名で強くすすめるより、7B/8B級、GGUF、Q4/Q5、ファイルサイズを見て軽いものから試すのが安全です。

Q4とQ5はどちらを選べばよいですか？

PCスペックに不安があるならQ4から、16GB以上で少し余裕を見たいならQ5も候補です。まずは動く範囲を確認しましょう。

日本語モデルだけを選べば大丈夫ですか？

日本語対応の説明は参考になりますが、実際の自然さは試して確認する必要があります。同じ短い質問で比較すると判断しやすいです。

LM Studioで最初に選ぶモデルは7Bと8Bのどちらですか？

数字だけで決める必要はありません。7B/8B級のInstructモデルから、GGUFのQ4_K_M前後でPCに収まるものを選び、モデルカードの日本語用途やライセンスも確認してください。

最初からQ5やQ8を選んでもよいですか？

PCに余裕があれば比較できますが、最初はQ4_K_M前後で動作基準を作る方が、ロード失敗や極端な遅さを避けやすいです。安定後にQ5を比較してください。

BaseモデルとInstructモデルのどちらを選びますか？

最初のチャットや質問回答にはInstructまたはChat向けが分かりやすいです。Baseモデルは追加調整や別用途を前提にすることがあり、初心者の最初の1本には向かない場合があります。

次に読むおすすめルート

初めてローカルAIを触る人

まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。

あなたはどのタイプ？

初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。

LM Studioで最初に選ぶモデルは？7B・8B・Q4_K_Mの選び方

導入前に確認すること

最初のモデルは「軽さ」と「出所」を両方見る

最初の1本は研究ベンチより体感確認を優先する

ファイル名で見る順番

最初の1本を選ぶ5条件

PCスペック別の開始目安

LM Studioで選ぶ順番

最初のテスト質問

うまく動かない時の戻り方

次に読む記事

よくある質問

LM Studioで最初におすすめのモデル名はありますか？

Q4とQ5はどちらを選べばよいですか？

日本語モデルだけを選べば大丈夫ですか？

LM Studioで最初に選ぶモデルは7Bと8Bのどちらですか？

最初からQ5やQ8を選んでもよいですか？

BaseモデルとInstructモデルのどちらを選びますか？

次に読むおすすめルート

初めてローカルAIを触る人

あなたはどのタイプ？

関連チェック先

関連ツール

LM Studioで最初に選ぶモデルは？7B・8B・Q4_K_Mの選び方

導入前に確認すること

最初のモデルは「軽さ」と「出所」を両方見る

最初の1本は研究ベンチより体感確認を優先する

ファイル名で見る順番

最初の1本を選ぶ5条件

PCスペック別の開始目安

LM Studioで選ぶ順番

最初のテスト質問

うまく動かない時の戻り方

次に読む記事

よくある質問

LM Studioで最初におすすめのモデル名はありますか？

Q4とQ5はどちらを選べばよいですか？

日本語モデルだけを選べば大丈夫ですか？

LM Studioで最初に選ぶモデルは7Bと8Bのどちらですか？

最初からQ5やQ8を選んでもよいですか？

BaseモデルとInstructモデルのどちらを選びますか？

次に読むおすすめルート

初めてローカルAIを触る人

あなたはどのタイプ？

次に読むおすすめ記事

関連チェック先

関連ツール