Tech Blog

技術ブログ

AI・データ解析・ローカルLLM など、エンジニア視点で技術トピックを解説します。

LLM

2026.06.10

6月9日リリースのClaude Fable 5を含む3社最新モデルのベンチマークを、自社公表・他社公式資料・第三者評価の3ソースを区別して徹底比較。安全フォールバックがスコアに影響する新世代特有の論点も解説。

LLM

2026.04.14

公式発表（一次ソース）と第三者評価（二次ソース）を明確に区別し、各社が「見せたかったもの」と「見せなかったもの」の差分からフロンティアLLMの得意・不得意を読み解く。

LLM

2026.04.03

2026年4月リリースのGoogle Gemma 4を、Qwen 3.5やLlama 4など主要オープンLLMとベンチマークで徹底比較。MMLU Pro・GPQA Diamond・LiveCodeBench等の最新スコアを表形式で整理。

まずは課題をご相談ください

現場のデータ形式や運用フローに合わせて、最適な機能設計をご提案します。

お問い合わせ