Qwen3.5とQwen3.6はどっちを選ぶ?
- 公開日
- 2026-05-28
- 更新日
- 2026-05-28
- 情報確認日
- 2026-05-28
LM StudioやHugging FaceでQwen3.5、Qwen3.6、GGUF、MTP、Heretic版という名前を見かけると、どれが新しくて、どれが軽くて、自分のWindows PCで試しやすいのか分かりにくくなります。この記事では、話題性ではなく「初心者が最初にどう選ぶと失敗しにくいか」を中心に整理します。
導入前に確認すること
- Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
- 最初は軽量モデル、短い質問、少ない同時作業から始める
- 公式サイトの対応OS、利用規約、モデルのライセンスを確認する
導入
Qwen系モデルは、Hugging FaceやLM Studioの検索結果で似た名前が並びやすいモデル群です。Qwen3.5、Qwen3.6、27B、35B-A3B、GGUF、Q4_K_M、MTP、Heretic、Uncensoredなどが一度に出てくると、初心者には「結局どれを選べばいいのか」が見えにくくなります。
この記事では、Qwen3.6を過剰に持ち上げるのではなく、通常版、GGUF版、MTP版、Heretic版を分けて考えます。Windows PCでLM StudioやOllamaを使う前に、モデル名だけでなく、モデルサイズ、量子化、PCメモリ、実行アプリを見るための整理として読んでください。
先に結論
- 新しさやコーディング用途の注目度では、Qwen3.6系が気になる候補になります。
- ただし、初心者が必ずQwen3.6を選ぶべきとは限りません。大きいモデルはPC要件も重くなりやすいです。
- 軽く試したいなら、Qwen3.5系の軽量GGUFや小さめの量子化版も候補です。
- コーディングやエージェント用途を意識するなら、Qwen3.6系を候補にしつつ、サイズと量子化を必ず確認します。
- LM Studioで試すなら、まずは通常のGGUF、軽めの量子化、自分のPCメモリに合うサイズから見るのが安全です。
- MTP版は速度面で話題になりますが、対応環境や設定に左右されます。MTPだから必ず速いとは考えない方がよいです。
- Heretic版はコミュニティ派生の実験寄りモデルです。初心者の最初の1本としては、通常版や一般的なGGUFの方が無難です。
Qwen3.5とは
Qwen3.5は、Qwen系の前世代として見かけることが多いモデル群です。軽量モデルから大きめモデルまで選択肢があり、ローカルPCで試す場合はGGUF化された軽めの量子化版が選びやすい候補になります。
Qwen3.5を選ぶときも、モデル名だけでは判断しないでください。LM StudioやOllamaで見つけたモデルが何B級なのか、GGUFかどうか、Q4/Q5/Q8のどれなのか、ファイルサイズがどれくらいかを見ます。古いから不要というより、PCに合う軽さを選びやすいことがあります。
Qwen3.6とは
Qwen3.6は、Qwen3.5の後続として注目されている新しい世代です。公式のQwen3.6-35B-A3Bモデルカードでは、35B総パラメータ、3BアクティブのMoE構成や、コーディング・エージェント用途を意識した説明が示されています。
一方で、新しい名前だから軽いとは限りません。27Bや35B-A3Bのような表記を見た場合、Windows初心者は「自分のPCメモリで現実的か」「LM Studioで扱いやすいGGUF量子化があるか」「CPU/GPUで待てる速度か」を先に見た方が安全です。
また、公式Qwen3.6と、Heretic、Uncensored、MTP Preserved、GGUF変換版のようなコミュニティ配布モデルは分けて考えます。配布ページの名前が似ていても、公式モデルそのものなのか、派生版なのか、変換版なのかで扱い方が変わります。
Qwen3.5とQwen3.6の比較表
| 見るポイント | Qwen3.5 | Qwen3.6 |
|---|---|---|
| 新しさ | 旧世代として見かけることが多い | 新世代として注目されやすい |
| 試しやすさ | 軽量版なら試しやすい | モデルによっては重い |
| ローカルPC向き | 軽量GGUFなら候補 | PC性能と量子化に注意 |
| コーディング用途 | まだ候補になる | より注目されやすい |
| 初心者向け | 軽いモデルを選びやすい | 名前だけで選ぶと重いことがある |
| 注意点 | 量子化とサイズを見る | 派生版・MTP版と混同しない |
この比較は、初心者がローカルPCで試す時のざっくり整理です。実際の速度や快適さは、モデルサイズ、量子化、PCメモリ、CPU/GPU、LM StudioやOllamaなどの実行アプリによって変わります。
GGUF版とは
GGUFは、LM Studioやllama.cpp系の実行環境でよく使われるモデルファイル形式です。Qwen3.5でもQwen3.6でも、GGUF版を使う場合はQ4、Q5、Q8などの量子化とファイルサイズを見る必要があります。
初心者は「Qwen3.6」とだけ書かれた名前ではなく、「何B級か」「GGUFか」「Q4_K_MやQ5_K_Mのような軽めの量子化か」「PCメモリに収まりそうか」を確認してください。迷う場合は、通常GGUFの軽めの量子化から動作確認する方が失敗しにくいです。
- GGUFとは?LM Studio・Ollamaで使うモデル形式を初心者向けに解説 - GGUFやQ4/Q5/Q8の選び方を詳しく確認する
- ローカルAIのモデルサイズ早見表 - 8GB、16GB、32GBでどの程度を狙うか確認する
MTP版とは
MTPはMulti-Token Predictionの略です。ざっくり言うと、次の1トークンだけでなく、その先のトークンも予測して出力を速くしようとする仕組みです。Qwen3.6の公式モデルカードでもMTPに触れられており、コミュニティ配布モデルでは「Native MTP Preserved」のような名前で見かけることがあります。
MTPは、うまく使える環境では出力を速くするための仕組みです。ただし、対応モデル、対応アプリ、推論設定が必要です。対応していないアプリや設定では効果を出せなかったり、メモリやKVキャッシュ面の負担が増えたりすることがあります。
初心者は「MTP版だから必ず速い」と考えない方が安全です。まず通常のGGUFで動作確認し、余裕があればMTP対応版や対応アプリを調べる、という順番の方が混乱しにくくなります。
Heretic版とは
Heretic版は、公式Qwenそのものではなく、コミュニティが調整した派生版として扱うのが安全です。Hugging Face上には、Qwen3.6系をHereticで調整し、GGUFやMTP preservedの形で配布しているページがあります。
このような派生版は、LocalLLaMAなどのコミュニティで話題になることがあります。ただし、Uncensored、refusal低下、abliterationといった文脈で語られることもあり、初心者が最初に選ぶモデルとして強くおすすめするものではありません。
Heretic版については、「公式版とは違う」「配布元、ライセンス、用途、変換形式を確認する必要がある」と分かっていれば十分です。最初の1本は、通常版、公式系、一般的なGGUFから選ぶ方が無難です。
目的別の選び方
| 目的 | 選び方の目安 |
|---|---|
| とにかく軽く試したい | Qwen3.5系の軽量GGUFを検討 |
| 16GBメモリで試したい | 7B〜9B級や軽量量子化から始める |
| 32GB以上ある | Qwen3.6系の軽量量子化も候補 |
| コーディング用途で試したい | Qwen3.6系を候補にしつつ、サイズと量子化を確認 |
| 速度実験をしたい | MTP対応版と対応アプリを調べる |
| LocalLLaMAで話題の派生版が気になる | Heretic版は公式版ではないと理解したうえで扱う |
| よく分からない | 通常GGUF、軽めの量子化、既存ガイドに沿って選ぶ |
初心者が避けたい失敗
- Qwen3.6という名前だけで、大きいモデルを軽いと思って選ぶ。
- 最初からQ8を選んで、読み込みや応答が重すぎる。
- 14B、27B、35Bなどのサイズ感を見ずにダウンロードする。
- Heretic版を公式版そのものだと思って使う。
- MTP版なのに、対応していない環境で速度改善を期待する。
- LM Studioで表示された名前だけを見て、量子化やファイルサイズを確認しない。
- 8GBや16GBのPCで大きいモデルを無理に動かそうとする。
うまく動かない時は、モデルを疑う前に、PCメモリ、ファイルサイズ、量子化、同時に開いているアプリ、実行アプリの設定を順番に確認すると原因を切り分けやすくなります。
次に読むべきページ
Qwen系モデル選びは、GGUF、モデルサイズ、実行アプリの理解とつながっています。Qwen3.5かQwen3.6かで迷う前に、まずWindowsローカルAI全体の入口と、GGUF・メモリ目安を確認しておくと選びやすくなります。
- WindowsでローカルAIを始める完全ガイド - LM Studio、Ollama、GGUF、AnythingLLMの全体像を確認する
- GGUFとは?LM Studio・Ollamaで使うモデル形式を初心者向けに解説 - GGUFと量子化の見方を確認する
- ローカルAIのモデルサイズ早見表 - PCメモリ別の目安を確認する
- ローカルAIでよくあるエラー集 - 重い、止まる、読み込めない時の確認ポイントを見る
- AnythingLLMとは? - PDFやメモを使いたい場合の役割分担を確認する
まとめ
Qwen3.6は新しく注目されているモデルですが、初心者にとって常に最適とは限りません。Qwen3.5も、軽量版やGGUFの選び方次第では十分に候補になります。
GGUFを選ぶ時は、モデル名だけでなく、量子化、モデルサイズ、ファイルサイズ、PCメモリを見ます。MTPは速度改善の可能性がありますが、対応環境とトレードオフがあります。Heretic版は公式版ではなく、初心者の最初の1本としては通常版の方が安全です。
迷ったら、通常のGGUF、軽めの量子化、自分のPCメモリに合うサイズから始めてください。そのうえで、WindowsローカルAI開始ガイド、GGUF記事、モデルサイズガイドを見ながら少しずつ選択肢を広げるのがおすすめです。
よくある質問
Qwen3.6はQwen3.5より必ず上ですか?
必ずしもそうとは限りません。Qwen3.6は新しく注目されていますが、初心者がローカルPCで試す場合は、モデルサイズ、量子化、PCメモリ、実行アプリとの相性も重要です。
MTP版なら必ず速くなりますか?
必ず速くなるとは限りません。MTPは対応環境ではレイテンシ改善が期待されますが、メモリやKVキャッシュとのトレードオフがあり、設定や環境に左右されます。
Heretic版は公式モデルですか?
いいえ。Heretic版は公式Qwenそのものではなく、コミュニティが調整した派生版として扱うのが安全です。初心者はまず通常版や一般的なGGUFから試す方が無難です。
LM Studioで試すなら何を見ればいいですか?
モデル名だけでなく、モデルサイズ、GGUFかどうか、Q4/Q5/Q8などの量子化、ファイルサイズ、自分のPCメモリを確認してください。
次に読むおすすめルート
初めてローカルAIを触る人
まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- クラウドAIとローカルAIの使い分け
- ローカルLLMとは
- ローカルAIを入れる前に確認すること
- WindowsでローカルAIを始める完全ガイド
- LM Studioとは
- GGUFとは
- 小型LLM・量子化の現実
- GGUF量子化安全とRAG/NPU研究
- Hugging Face安全チェック
- PDF/RAG/引用確認の現実
- LM Studioで最初に選ぶモデル
- GGUFモデル選び診断
- Hugging FaceでGGUFモデルを探す方法
- Q4/Q5/Q8の違いと選び方
- Q4/Q5/Q8研究ガイド
- Hermes Desktopとは
- Hermes DesktopとLM Studio接続
- Hermes DesktopとOllama接続
- Hermes Desktop接続トラブル
- Hermes AgentとDesktopの違い
- ローカルLLMツール比較
- ローカルAI更新メモ
- 診断ページ
あなたはどのタイプ?
- 初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
- PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
- 開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
関連チェック先
- Qwen/Qwen3.6-35B-A3B - Qwen公式名義のQwen3.6-35B-A3Bモデルカード。モデル概要、MTP、対応環境などを確認できます。
- Qwen3.6 Heretic MTP GGUF配布例 - Heretic、MTP preserved、GGUFが組み合わさったコミュニティ派生モデルの配布例です。公式モデルそのものとは分けて確認してください。