ChatGPT・Gemini・Claudeが進化してもローカルAIは必要?LM Studioとの使い分け
- 公開日
- 2026-06-09
- 更新日
- 2026-06-09
- 情報確認日
- 2026-06-09
ChatGPT、Gemini、Claude、GrokのようなクラウドAIが進化しても、ローカルAIの役割は消えません。普段使い、最新性能、高度な推論、画像や資料の総合処理はクラウドAIが強く、手元検証、外部送信を避けたい用途、GGUFモデル比較、LM StudioやOllamaの学習にはローカルAIが向きます。初心者は「クラウドAIかローカルAIか」ではなく、「何を任せるか」で分けるのが現実的です。
導入前に確認すること
- Windowsのバージョン、メモリ容量、GPU/VRAM、空き容量を確認する
- 最初は軽量モデル、短い質問、少ない同時作業から始める
- 公式サイトの対応OS、利用規約、モデルのライセンスを確認する
まず結論
- ChatGPT、Gemini、Claude、GrokのようなクラウドAIが進化しても、ローカルAIの役割は消えません。
- 普段使い、最新性能、高度な推論、画像・音声・資料処理はクラウドAIが強く、手元検証、外部送信を避けたい用途、モデル比較はローカルAIが向きます。
- 初心者は「どちらが上か」ではなく、「何を任せるか」でChatGPTなどとLM Studio、Ollama、GGUFを使い分けるのが現実的です。
ローカルAIは、ChatGPTを完全に置き換えるための道具ではありません。むしろ、クラウドAIでは見えにくいモデルファイル、量子化、PCスペック、APIサーバー、外部送信の有無を自分で確認するための学習・検証環境です。
一方で、仕事の文章作成、複雑な調査、コーディング、マルチモーダル処理、スマホからの利用では、クラウドAIを使うほうが速くて楽な場面が多いです。この記事では、両方を対立させず、Windows初心者が迷いにくい使い分けに落とし込みます。
この記事で扱うこと
この記事では、大手クラウドAIモデルの更新ラッシュを入口にしつつ、「それでもローカルAIは必要なのか」「LM Studio、Ollama、GGUF、Hermes Desktopをどう位置づければよいのか」を整理します。
ChatGPT 5.6、Gemini Pro新型、Claude Mythos、Grok新型などの名称がネット上で話題になることがありますが、本記事では公式発表前のモデル名や性能を断定しません。公式に確認できる発表済みの流れだけを土台にして、ローカルAI利用者がどう考えればよいかを扱います。
ここでの目的は、最新モデル名を追いかけることではありません。クラウドAIが強くなるほど、どの作業をクラウドに任せ、どの作業を手元のPCで検証するのかを決める力が大切になります。
大手クラウドAIモデル更新ラッシュで起きていること
OpenAI、Google、Anthropic、xAIの公式発表を見ると、近年のクラウドAIは単に「文章がうまいチャット」から、推論、コーディング、マルチモーダル、長文処理、ファイル処理、エージェント的な作業支援へ広がっています。
- 推論能力の強化: 難しい質問、計画、検証、長い作業手順を扱いやすくする方向に進んでいる
- コーディング能力の強化: IDE、CLI、コードレビュー、複数ファイル編集に近い体験が増えている
- マルチモーダル対応: テキストだけでなく、画像、音声、動画、資料をまたぐ使い方が広がっている
- 長文コンテキスト: 長い会話、長い資料、複数ファイルを扱う機能が強化されている
- エージェント機能: ツール連携、ブラウザ操作、ファイル操作、タスク実行に近い機能が増えている
- 業務向け機能: 管理、権限、共有、データ保護、チーム利用の設定が重視されている
- 個人向けサブスクの高度化: 無料枠、上位プラン、モデル選択、制限、機能差が変わり続けている
この流れだけを見ると、「最新クラウドAIがあればローカルAIはいらないのでは」と感じるのは自然です。実際、最高性能だけを求めるなら、多くの人にとってクラウドAIのほうが現実的です。
ただし、クラウドAIの進化はローカルAIの価値を消すというより、役割の違いをはっきりさせています。クラウドAIは強い完成品サービス、ローカルAIは手元でモデルと実行環境を理解するための実験台、と考えると整理しやすくなります。
クラウドAIが強い場面
ChatGPT、Gemini、Claude、GrokのようなクラウドAIは、初心者がすぐ成果を出したい場面で非常に強いです。アカウントを作ればブラウザやスマホから使え、PCのメモリやGPUを気にせず、提供側の最新モデルや機能を利用できます。
- 最新の高性能モデルをすぐ使いたい
- 高度な推論、設計、文章作成、コードレビューを任せたい
- 画像、音声、動画、PDF、スプレッドシートなどを一体で扱いたい
- スマホやブラウザから手軽に使いたい
- 自分のPCスペックに左右されたくない
- 仕事の下書き、会議準備、一般的な調べ物、要約を速く済ませたい
- ログイン、同期、履歴、共有、チーム機能を使いたい
とくに「今日は仕事を進めたい」「環境構築で止まりたくない」「最高性能に近い回答がほしい」という場面では、クラウドAIを中心にしたほうが効率的です。Local AI Compassでも、初心者にいきなりローカルAIだけをすすめるわけではありません。
ローカルAIが残る場面
ローカルAIの価値は、クラウドAIより常に賢いことではありません。自分のPC上でモデルを動かし、モデルごとの差、PCスペックの限界、外部送信の有無、API連携の仕組みを手で確認できるところにあります。
- 手元のWindows PCでモデルを試したい
- 外部送信を避けたいデータで、まず小さく検証したい
- API費用、回数制限、サブスク制限を気にせず実験したい
- オフラインまたは閉じた環境に近い形で試したい
- GGUFモデル、量子化、7B/8B/13Bなどの差を体感したい
- LM StudioやOllamaでモデルごとの速度や日本語の自然さを比べたい
- RAG、API server、Hermes Desktopなどの連携を学びたい
- AIの中身、モデルファイル、実行負荷、PCスペックの関係を理解したい
たとえば、LM Studioで軽いGGUFモデルを1つ入れて短い日本語質問を試すだけでも、モデルサイズ、量子化、メモリ、GPU、ストレージの関係が見えてきます。これはクラウドAIだけを使っていると体感しにくい部分です。
クラウドAIとローカルAIの比較表
どちらが優れているかではなく、比較軸ごとに向き不向きを見ると判断しやすくなります。
| 比較軸 | ChatGPT / Gemini / Claude / Grok など | LM Studio / Ollama / GGUF など | 初心者向けの見方 |
|---|---|---|---|
| 使い始めやすさ | アカウント作成後すぐ使いやすい | ツール導入とモデル選びが必要 | 最短で成果ならクラウドAI |
| 性能 | 最新の高性能モデルを使いやすい | モデルとPCスペックに左右される | 最高性能目的ならクラウドAI中心 |
| 最新性 | 提供側の更新をすぐ受けやすい | 自分でモデルを探して更新する | 噂ではなく公式発表と配布元を見る |
| PCスペック依存 | ほぼサービス側が負担 | CPU、メモリ、GPU、VRAMに依存 | 古いPCでは軽量モデルから |
| 外部送信 | 入力はサービス側へ送られる前提で規約確認が必要 | 構成次第で手元処理に寄せられる | ローカルでもツール設定とログ確認は必要 |
| 費用 | 無料枠、月額、従量課金、制限がある | ツールは無料でもPC、電気代、時間がかかる | 無料で無限とは考えない |
| オフライン性 | 基本は通信が必要 | モデル取得後はオフラインに近い使い方ができる場合がある | 完全オフラインかは構成確認が必要 |
| モデル選択 | サービスが用意したモデルから選ぶ | GGUFやOllamaモデルを自分で選ぶ | 選べる分、迷いやすい |
| カスタマイズ性 | サービス範囲内で設定する | モデル、量子化、API、RAG構成を調整できる | 学習用途ではローカルが強い |
| セキュリティ・プライバシー | サービス規約、管理機能、社内ルールに依存 | 手元処理に寄せられるが自己管理が増える | どちらも完全安全とは断定しない |
| 学習・検証用途 | AI活用の成果を学びやすい | AI実行環境そのものを学びやすい | 仕組みを知りたいならローカル |
| 業務利用のしやすさ | 法人向け管理や共有が整いやすい | 社内構築や検証には向くが運用設計が必要 | 会社ルールが最優先 |
| トラブル時の難しさ | サービス側の制限や仕様変更に左右される | PC、モデル、設定、ログを自分で見る必要がある | 初心者はLM Studioから小さく試す |
用途別おすすめ表
実際の選び方は、用途から決めるのがいちばん簡単です。
| やりたいこと | 中心にする候補 | 理由 | Local AI Compass内の次の導線 |
|---|---|---|---|
| 文章作成・日常相談 | ChatGPT / Gemini / ClaudeなどクラウドAI | 速く、手軽で、PCスペックに左右されにくい | /articles/chatgpt-vs-local-ai/ |
| 最高性能の推論やコーディング | クラウドAI中心 | 最新モデル、長文、ツール連携、コード支援が強い | /articles/what-is-local-llm/ |
| モデルファイルやGGUFを試す | LM Studio | GUIでモデル検索、読み込み、チャットを試しやすい | /articles/lm-studio-first-model/ |
| コマンドやAPIでローカルモデルを使う | Ollama | CLI、API、他ツール連携に進みやすい | /tools/ollama/ |
| ローカルAIを作業エージェントとして試す | Hermes Desktop / Hermes Agent | LM StudioやOllamaをモデル実行側として使う発展先 | /articles/hermes-desktop-local-ai-windows/ |
| PDFや手元資料を試す | AnythingLLM / RAG系 | 文書取り込みと検索の仕組みを組み合わせる | /tools/anythingllm/ |
| PCスペックを見ながら軽く試す | LM Studio + 軽量GGUF | 7B/8B級、Q4前後から切り分けやすい | /articles/local-ai-pc-spec-guide/ |
| 機密性が高い資料 | まず社内ルール確認。構成次第でローカルAIも候補 | 外部送信、ログ、履歴、モデル出所を確認する必要がある | /articles/local-llm-security-privacy-guide/ |
表のURLは、この記事内の読み順で後から自然にたどれるようにしています。いきなり全部を開く必要はありません。まずは自分の目的に近い行だけ見てください。
初心者はどう使い分けるべきか
初心者は、普段使いをクラウドAIに寄せ、ローカルAIは「自分のPCでモデルが動くとはどういうことか」を理解する目的で始めるのが無理のない入口です。
- 普段の相談、文章作成、調査、コーディング支援はChatGPT、Gemini、ClaudeなどクラウドAIを使う
- ローカルAIは、LM Studioで軽量GGUFを1つ動かすところから始める
- 最初のモデルは7B/8B級、Q4前後、ファイルサイズが大きすぎない候補にする
- GGUF、Q4/Q5/Q8、モデルサイズ、メモリ、GPU/VRAMの意味を少しずつ理解する
- 重ければ、PCスペック、メモリ、SSD空き容量、冷却、同時起動アプリを確認する
- API連携やOllamaは、LM Studio単体で短いチャットが安定してから試す
- Hermes DesktopやRAGは、モデル実行側と外部送信の確認ができてから進める
この順番なら、うまく動かない時にも原因を分けやすくなります。最初からOllama、RAG、Hermes、MCP、複数モデル比較を同時に始めると、どこで詰まっているのか分かりにくくなります。
初心者向け判断フロー
迷ったら、次の順番で判断してください。
- 今日すぐ成果がほしいなら、まずクラウドAIを使う
- 外部送信が気になる資料なら、サービス規約、社内ルール、データ分類を先に確認する
- ローカルAIに興味があるなら、LM Studioで軽いGGUFを1つだけ試す
- モデル名やQ4/Q5で迷ったら、GGUF記事と量子化記事を読む
- PCが重いなら、モデルサイズ、メモリ、GPUなしPCの記事で切り分ける
- コマンドやAPIで使いたくなったら、OllamaやAPI serverの記事へ進む
- 作業エージェントや文書活用に進みたくなったら、Hermes DesktopやAnythingLLMの記事へ進む
このフローのポイントは、「クラウドAIを使うこと」と「ローカルAIを学ぶこと」を競合させないことです。仕事ではクラウドAI、手元検証ではLM Studio、API学習ではOllama、文書活用ではAnythingLLMというように分けると、無理なく続けられます。
ローカルAIが不要ではない理由
高性能なクラウドAIがあっても、すべての文章、資料、ログ、社内情報、個人メモを外部サービスに送れるわけではありません。サービス側の規約、会社のルール、顧客との契約、個人情報の扱いによっては、そもそも入力できないデータがあります。
また、クラウドAIは便利ですが、仕様、料金、利用制限、モデル選択、ポリシー、UI、提供地域、アカウント状態に依存します。昨日まで使えていた機能が、プラン変更や仕様変更で変わることもあります。
ローカルAIは最高性能ではない場合が多いものの、検証、学習、プライバシー確認、オフラインに近い利用、モデル差の比較に価値があります。モデルファイルを自分で選び、PCに読み込ませ、速度や日本語の自然さを比べる経験は、AIをブラックボックスのサービスとしてだけ使う場合とは違う理解につながります。
特に個人開発者や技術学習者にとって、LM StudioやOllamaでモデルを動かす経験は、API、RAG、エージェント、MCP、ツール連携を理解する土台になります。ChatGPTの代替ではなく、クラウドAI時代にAIの仕組みを手元で学ぶ別用途の道具として考えるほうが自然です。
逆にローカルAIを急がなくていい人
公平に言えば、すべての人が今すぐローカルAIを始める必要はありません。次のような人は、まずクラウドAIで十分なことが多いです。
- とにかく高性能な回答が欲しい
- PCスペック、メモリ、GPU、保存容量を気にしたくない
- 環境構築やエラー対応が苦手
- 仕事で成果を急いでいて、検証に時間を使いたくない
- 画像、音声、動画、資料読み取りまで一体で使いたい
- スマホ中心でAIを使いたい
- API、モデルファイル、GGUF、量子化に興味がない
この場合は、まずChatGPT、Gemini、Claudeなどを使い、必要になったタイミングでローカルAIを学べば十分です。ローカルAIは「やらないと遅れている」と焦るものではありません。
ローカルAIを試す価値がある人
一方で、次のような人にはローカルAIを試す価値があります。
- LM StudioやOllamaに興味がある
- GGUFモデル、Q4/Q5/Q8、7B/8B/13Bの違いを自分で見たい
- 自分のWindows PCでどこまで動くか試したい
- データの外部送信を減らす選択肢を持ちたい
- API server、OpenAI互換API、RAG、文書チャットを触りたい
- Hermes Desktopや作業エージェント連携に興味がある
- PCスペック、メモリ、GPU、SSD、冷却とAI実行の関係を理解したい
- クラウドAIを使いながら、モデル実行側の仕組みも学びたい
ローカルAIは、最初から完璧に使いこなすものではありません。小さいモデルで短い質問を試し、重ければ条件を下げ、少しずつOllama、API、RAG、Hermesへ広げるくらいで十分です。
LM Studio / Ollama / GGUF / Hermes Desktopの位置づけ
ローカルAIの道具は名前が多く、初心者ほど混乱しやすいです。まずは役割で分けてください。
| 名前 | ざっくりした役割 | 最初に向く人 | 注意点 |
|---|---|---|---|
| LM Studio | GUIでローカルモデルを探し、読み込み、チャットやローカルサーバーを試す入口 | 画面操作で始めたい人 | 重いモデルを選ぶと止まりやすい |
| Ollama | コマンドやAPIでローカルモデルを扱う実行環境 | 開発、API、他ツール連携に進みたい人 | モデル名、実行状態、APIの理解が必要 |
| GGUF | ローカル推論でよく使われるモデルファイル形式のひとつ | LM Studioでモデルを選びたい人 | GGUF、量子化、モデルサイズは別の概念 |
| Hermes Desktop | Hermes Agentをデスクトップで扱いやすくする発展的な環境 | LM StudioやOllamaに慣れて作業エージェントを試したい人 | モデル実行側そのものではない点に注意 |
| AnythingLLM / RAG系 | PDFや資料を取り込み、検索と回答を組み合わせる文書活用環境 | 手元資料をAIに参照させたい人 | 外部送信、埋め込み、文書分割、モデル性能を確認する |
初心者の最初の一歩は、LM Studioで十分です。Ollamaは便利ですが、コマンド操作やAPI連携が出てくるため、最初から無理に選ぶ必要はありません。Hermes Desktopはさらに後の段階で、LM StudioやOllamaをモデル実行側として理解してからのほうが迷いにくくなります。
Local AI Compass内のおすすめ読み順
この記事から先は、目的別に読むと迷いにくくなります。全部を一気に読む必要はありません。
- 全体の入口 - WindowsでローカルAIを始める順番、LM Studio、Ollama、GGUF、AnythingLLMの全体像を見る
- ローカルLLMとは - ChatGPTとの違い、できること、PCスペック、最初のツール選びを確認する
- GGUFとは - LM Studioで見るモデルファイル、Q4/Q5、7B/8Bの前提を理解する
- LM Studioで最初に選ぶモデル - 最初の1本を軽く選び、短い日本語質問で試す流れを見る
- 量子化Q4/Q5/Q8 - 軽さと品質の目安を確認する
- モデルサイズ早見表 - 8GB、16GB、32GBで狙いやすいモデルサイズを見る
- PCスペックの見方 - メモリ、GPU、VRAM、SSD、CPUを確認する
- GPUなしPCで使える範囲 - CPU実行や軽量モデルの現実的なラインを見る
- LM StudioとOllamaの違い - GUIで始めるか、コマンド/APIで進むかを比較する
- ローカルAI APIサーバー入門 - LM StudioやOllamaをAPIとして使う考え方へ進む
- 安全性とプライバシー - 外部送信、履歴、ログ、RAG、MCP、モデル出所を確認する
- Hermes Desktopとは - LM StudioやOllamaに慣れた後の作業エージェント環境を整理する
ツールごとの入口は、LM Studio、Ollama、AnythingLLMの各ツールページに分けています。まずLM Studioでモデル単体を動かし、次にOllamaやAPI、文書活用へ進むと原因を切り分けやすくなります。
- LM Studioツールページ - GUIでローカルモデルを試す入口
- Ollamaツールページ - コマンド、API、他ツール連携へ進む入口
- AnythingLLMツールページ - PDFやメモをAIチャットとつなぐ入口
Amazon商品カードについて
この記事には、現時点でAmazon商品カードを直接入れていません。この記事は、クラウドAIとローカルAIの使い分けを整理する上流記事だからです。
PC購入や周辺機器の判断が必要になった場合は、PCスペック記事、GPUなしPC記事、中古PC記事、トラブル記事へ進んでから確認するほうが自然です。共通フッターやプライバシーポリシーのアフィリエイト表記は、サイト全体の表記として維持します。
まとめ
ChatGPT、Gemini、Claude、GrokのようなクラウドAIが進化するほど、普段使いはクラウドAIで十分な場面が増えます。これはローカルAIにとって悪いことではなく、役割を分けやすくなるということです。
ローカルAIは、最高性能のクラウドAIに正面から勝つためのものではありません。LM StudioでGGUFモデルを試し、OllamaでAPIを触り、必要に応じてAnythingLLMやHermes Desktopへ進むことで、AIを「使う」だけでなく「動かし方を理解する」ための道具になります。
公式発表が出たモデルや機能は、今後も更新されます。この記事も、未確認の噂を断定するのではなく、発表済みの事実とLocal AI Compass内の実用導線をもとに更新していく土台記事として扱います。
よくある質問
ChatGPTが進化したらローカルAIは不要になりますか?
不要とは言い切れません。普段使いと最高性能はクラウドAIが強い一方で、手元検証、外部送信を避けたい用途、GGUFモデル比較、APIやRAGの学習ではローカルAIの価値が残ります。
初心者はChatGPTとLM Studioのどちらから使うべきですか?
成果を急ぐならChatGPTなどのクラウドAI、ローカルAIの仕組みを学びたいならLM Studioからが現実的です。多くの初心者は、普段使いはクラウドAI、手元検証はLM Studioという併用が向いています。
ローカルAIはChatGPTより賢いですか?
一般には、最高性能のクラウドAIのほうが強い場面が多いです。ローカルAIは賢さだけで選ぶのではなく、手元処理、検証、モデル比較、外部送信を減らす選択肢として見ます。
ローカルAIは完全に安全ですか?
完全に安全とは断定できません。ローカルAIでも、モデルの出所、ツール設定、ログ、履歴、RAG、MCP、外部API連携、社内ルールを確認する必要があります。
ローカルAIなら外部送信はゼロですか?
構成によります。モデル本体の実行は手元でも、モデルダウンロード、アップデート、クラウドAPI接続、埋め込みAPI、MCPツール、ログ送信などで通信が発生する場合があります。
LM StudioとOllamaは何が違いますか?
LM StudioはGUIでモデル検索、読み込み、チャット、ローカルサーバーを試しやすい入口です。OllamaはコマンドやAPI、他ツール連携に向く実行環境です。初心者はLM Studioから始めると原因を切り分けやすいです。
GGUFとは何ですか?
GGUFは、ローカル推論でよく使われるモデルファイル形式のひとつです。LM Studioでモデルを選ぶ時は、GGUFかどうか、7B/8Bなどのモデルサイズ、Q4/Q5/Q8などの量子化、ファイルサイズを分けて見ます。
GPUなしPCでもローカルAIは試せますか?
軽量モデルなら試せる場合があります。ただし速度は控えめに見て、7B/8B級、Q4前後、短い入力から始めるのが現実的です。大きいモデルやPDF活用は後回しにしてください。
ChatGPTとローカルAIを併用する意味はありますか?
あります。日常の相談や高度な推論はクラウドAI、モデル比較や外部送信を避けたい検証はローカルAI、API学習はOllama、文書活用はAnythingLLMのように分けると無理がありません。
Hermes Desktopは初心者にも必要ですか?
最初から必須ではありません。Hermes Desktopは作業エージェント的な発展先として考え、まずLM StudioやOllamaでモデル単体が安定して動くことを確認してから進むほうが安全です。
最新AIモデルの噂は追うべきですか?
気にしてもよいですが、公式発表前のモデル名、性能、リリース日を前提に環境を作るのは避けてください。初心者は、発表済みの情報、配布元、ライセンス、対応ツール、PCスペックを優先して確認するほうが実用的です。
業務利用ではクラウドAIとローカルAIのどちらが安全ですか?
どちらが常に安全とは言えません。クラウドAIは法人向け管理や契約条件を確認し、ローカルAIは外部送信、ログ、モデル出所、端末管理を確認する必要があります。最終的には社内ルールとデータ分類を優先してください。
次に読むおすすめルート
初めてローカルAIを触る人
まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- ローカルLLMとは
- ローカルAIを入れる前に確認すること
- WindowsでローカルAIを始める完全ガイド
- LM Studioとは
- GGUFとは
- 小型LLM・量子化の現実
- GGUF量子化安全とRAG/NPU研究
- Hugging Face安全チェック
- PDF/RAG/引用確認の現実
- LM Studioで最初に選ぶモデル
- GGUFモデル選び診断
- Hugging FaceでGGUFモデルを探す方法
- Q4/Q5/Q8の違いと選び方
- Q4/Q5/Q8研究ガイド
- Hermes Desktopとは
- Hermes DesktopとLM Studio接続
- Hermes DesktopとOllama接続
- Hermes Desktop接続トラブル
- Hermes AgentとDesktopの違い
- ローカルLLMツール比較
- ローカルAI更新メモ
- 診断ページ
あなたはどのタイプ?
- 初めてローカルAIを触る人 - まず全体像をつかみ、LM StudioとOllamaの違い、モデルサイズの考え方を順番に確認します。
- GPUなし・低スペックPCの人 - 軽量モデル、メモリ別の目安、重いときの確認ポイントを先に見ます。
- PDFや資料を読ませたい人 - 先に基本を押さえ、モデル単体の確認後にAnythingLLMへ進みます。
- 開発・API連携したい人 - LM StudioとOllamaの違いを確認し、API、長文処理、RAGまで段階的に進みます。
関連チェック先
- ChatGPT Release Notes - ChatGPTのモデル選択、画像、深い調査、ファイル、音声などの更新状況を確認した公式リリースノートです。
- Official Gemini news and updates - Geminiアプリ、Geminiモデル、マルチモーダル機能、エージェント的な機能更新を確認したGoogle公式ブログです。
- Anthropic News - Claudeのモデル更新、長文コンテキスト、コーディング、エージェント的な作業支援の発表を確認したAnthropic公式ニュースです。
- xAI News - GrokやGrok Buildなど、xAIの公式発表を確認したニュースページです。
- LM Studio Docs - LM Studioでローカルモデルを実行する基本、GGUF/MLX、ローカルサーバー、API機能を確認した公式ドキュメントです。
- Ollama Documentation - Ollamaのローカル実行、モデル管理、API、Python/JavaScriptライブラリを確認した公式ドキュメントです。
- Hugging Face Hub GGUF Docs - GGUFモデルの配布、メタデータ、Hugging Face Hub上での扱いを確認した公式ドキュメントです。
- llama.cpp README - GGUFモデルを扱う代表的なローカル推論基盤として、llama.cppの公式リポジトリを確認しました。