
LLM
2026.04.14
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro vs Muse Spark — 4モデルのベンチマーク徹底比較と得意・不得意マップ
公式発表(一次ソース)と第三者評価(二次ソース)を明確に区別し、各社が「見せたかったもの」と「見せなかったもの」の差分からフロンティアLLMの得意・不得意を読み解く。
Tech Blog
AI・データ解析・ローカルLLM など、エンジニア視点で技術トピックを解説します。

2026.04.14
公式発表(一次ソース)と第三者評価(二次ソース)を明確に区別し、各社が「見せたかったもの」と「見せなかったもの」の差分からフロンティアLLMの得意・不得意を読み解く。

2026.04.03
2026年4月リリースのGoogle Gemma 4を、Qwen 3.5やLlama 4など主要オープンLLMとベンチマークで徹底比較。MMLU Pro・GPQA Diamond・LiveCodeBench等の最新スコアを表形式で整理。
現場のデータ形式や運用フローに合わせて、最適な機能設計をご提案します。