
LLM
2026.06.10
Claude Fable 5 vs GPT-5.5 vs Gemini 3.5 Flash — 3社最新フロンティアLLMベンチマーク徹底比較
6月9日リリースのClaude Fable 5を含む3社最新モデルのベンチマークを、自社公表・他社公式資料・第三者評価の3ソースを区別して徹底比較。安全フォールバックがスコアに影響する新世代特有の論点も解説。
Tech Blog
AI・データ解析・ローカルLLM など、エンジニア視点で技術トピックを解説します。

2026.06.10
6月9日リリースのClaude Fable 5を含む3社最新モデルのベンチマークを、自社公表・他社公式資料・第三者評価の3ソースを区別して徹底比較。安全フォールバックがスコアに影響する新世代特有の論点も解説。

2026.04.14
公式発表(一次ソース)と第三者評価(二次ソース)を明確に区別し、各社が「見せたかったもの」と「見せなかったもの」の差分からフロンティアLLMの得意・不得意を読み解く。

2026.04.03
2026年4月リリースのGoogle Gemma 4を、Qwen 3.5やLlama 4など主要オープンLLMとベンチマークで徹底比較。MMLU Pro・GPQA Diamond・LiveCodeBench等の最新スコアを表形式で整理。
現場のデータ形式や運用フローに合わせて、最適な機能設計をご提案します。