模型评分卡

MetaChat 近期活跃模型的结构化评估，按使用热度排序。每张卡片包含官方定位、社区评价、能力评分与适用场景。

评分标准：⭐ 1-5 分（5 = 业界顶尖）

GPT-5

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 综合能力均衡，各项指标无明显短板；响应速度快；生态成熟，兼容性好

劣势： 非最强旗舰，深度推理不如 GPT-5.5/Claude Opus

适合： 通用对话、内容创作、翻译、日常编程、客服

Claude Sonnet 4.6

厂商： Anthropic | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 编程能力强且速度快；价格远低于 Opus 系列；指令遵循精准

劣势： 复杂多步推理不如 Opus；超长文档处理能力有限

适合： 日常编程、代码审查、文档生成、API 开发

Claude Opus 4.6

厂商： Anthropic | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐

优势： 深度推理稳定可靠；长文写作质量高；社区口碑好，稳定性优于 4.7

劣势： 响应速度较慢；价格较高

适合： 复杂分析、长文档处理、需要高稳定性的生产环境

Claude Opus 4.7

厂商： Anthropic | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐

优势： one-shot coding 能力顶尖；xhigh 推理级别精细可控；会主动对代码做证明再动手

劣势： 社区反馈幻觉增多；tokenizer 产生 token 数比前代多约 35%；部分用户反馈不如 4.6 稳定

适合： 大型编程项目、代码架构设计、系统级开发

Gemini 3.5 Flash

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐
多模态	⭐⭐⭐⭐

优势： Flash 价格超越上代旗舰 3.1 Pro；速度是同级模型的 4 倍；编程和 Agent 基准优异

劣势： 创意写作和中文细腻度不如 Claude/GPT；刚发布社区数据仍在积累

适合： 高频 API 调用、Agent 编排、编程辅助、成本敏感的生产场景

GPT-5.5

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐
多模态	⭐⭐⭐⭐⭐

优势： 多模态理解能力强，图文混合推理业界领先；指令遵循精准，复杂任务拆解能力优秀；Terminal-Bench 82.7%，幻觉率降低 52.5%

劣势： 价格较高（$5/$30），重度使用成本显著；中文创意写作偶有英文思维痕迹

适合： 深度分析、复杂编程、多模态任务、商业/法律/教育

Grok 4.3

厂商： xAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐

优势： AIME 93.3%，数学推理顶尖；Codeforces 2015 分；支持实时信息访问；256K 上下文

劣势： 中文能力缺乏独立评测；创意写作风格偏"干"

适合： 数学竞赛、编程、复杂推理、实时信息查询

DeepSeek V4 Pro

厂商： DeepSeek | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： SWE-bench 80.6% 逼近 Claude；价格仅 $0.435/$0.87（GPT-5.5 的 1/10）；100 万 token 上下文；开源可本地部署

劣势： 综合知识理解排名中游；英文创意写作偏弱；Agent 多步任务不如 Claude/GPT

适合： 编程开发、中文对话、成本敏感的 API 调用、本地部署

DeepSeek V4 Flash

厂商： DeepSeek | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 速度极快；成本仅为 GPT 的 1/10；中文表现优秀

劣势： 深度推理不如 Pro 版本；复杂任务能力有限

适合： 中文对话、高频轻量任务、成本敏感的批量处理

Gemini 3.1 Pro

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐⭐
多模态	⭐⭐⭐⭐⭐

优势： 超长上下文窗口（100 万 token）；多模态能力强（视频/音频/图像理解）

劣势： 中文创意写作一般；响应速度中等

适合： 超长文档分析、多模态理解、视频/音频内容处理

GPT-5.4

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐

优势： 性能稳定可靠；推理能力强；生态成熟

劣势： 已被 5.5 超越；价格不低

适合： 深度分析、复杂编程、商业写作

GPT-5.4 Mini

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 速度快价格低；日常任务够用；兼容性好

劣势： 深度推理和复杂编程能力有限

适合： 日常对话、简单问答、高频轻量任务

Grok 4.20

厂商： xAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 支持实时信息访问；响应速度快；推理能力不错

劣势： 中文表现一般；创意写作偏弱

适合： 需要最新信息的查询、快速问答、时事分析

Claude Haiku 4.5

厂商： Anthropic | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 极速响应；价格极低；指令遵循好

劣势： 深度推理能力有限；复杂任务不适合

适合： 分类、摘要、简单问答、高并发场景

GPT Image 2

厂商： OpenAI | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐⭐
文字渲染	⭐⭐⭐⭐⭐
风格多样性	⭐⭐⭐⭐
中文文字	⭐⭐⭐⭐
生成速度	⭐⭐⭐
性价比	⭐⭐⭐

优势： 文字渲染能力业界最强；支持复杂排版和多语言文字嵌入；图像质量高

劣势： 生成速度较慢；价格较高；纯艺术风格不如 Midjourney

适合： 海报/Logo 设计、产品图、社交媒体配图、需要精确文字的场景

Midjourney V7

厂商： Midjourney | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐⭐
文字渲染	⭐⭐⭐
风格多样性	⭐⭐⭐⭐⭐
美学表现	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 美学表现顶尖；艺术风格多样；构图和光影出色

劣势： 文字渲染不如 GPT Image；精确控制能力有限

适合： 艺术创作、概念设计、品牌视觉、插画

Seedance 2.0

厂商： 字节豆包 | 类型： 视频生成

维度	评分
视频质量	⭐⭐⭐⭐
动作自然度	⭐⭐⭐⭐⭐
中文场景	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐
风格多样性	⭐⭐⭐⭐

优势： 动作自然流畅；中文场景优化好；支持多种风格；最新一代

劣势： 英文场景表现不如 Sora；超长视频能力有限

适合： 短视频创作、产品展示、中文场景视频

Sora 2

厂商： OpenAI | 类型： 视频生成

维度	评分
视频质量	⭐⭐⭐⭐⭐
动作自然度	⭐⭐⭐⭐
画面精细度	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐
风格多样性	⭐⭐⭐⭐

优势： 画质精细；运动连贯性好；场景理解能力强

劣势： 生成速度较慢；价格较高

适合： 高画质视频、广告素材、产品宣传片

GPT-4o

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐
多模态	⭐⭐⭐⭐⭐

优势： 多模态原生支持（视觉+语音）；响应速度快；综合能力均衡

劣势： 已被 GPT-5 系列超越；深度推理不如新一代

适合： 多模态对话、语音交互、图像理解、通用任务

GPT-4o Mini

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 极低价格；速度极快；日常任务够用

劣势： 深度推理有限；已是上一代架构

适合： 高频轻量任务、成本敏感场景、简单问答

Gemini 3 Flash

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 速度极快；价格低；适合轻量任务

劣势： 深度推理和创意写作一般

适合： 快速问答、摘要、分类、高频调用

Gemini 3.1 Flash Lite

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐
编程能力	⭐⭐
创意写作	⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： Google 最轻量模型；极速响应；成本极低

劣势： 仅适合简单任务；复杂场景能力不足

适合： 文本分类、摘要提取、高并发轻量任务

Gemini 2.5 Pro

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐⭐
多模态	⭐⭐⭐⭐

优势： 100 万 token 超长上下文；多模态理解；价格合理

劣势： 已被 3.x 系列超越；中文表现一般

适合： 超长文档分析、代码库理解、多模态任务

Gemini 2.5 Flash

厂商： Google | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 速度快价格低；100 万 token 上下文；适合批量处理

劣势： 已被 3.5 Flash 超越；深度推理有限

适合： 批量文本处理、长文档摘要、高频轻量调用

GPT-4.1

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 综合能力均衡；100 万 token 上下文；价格适中

劣势： 已是上一代；被 GPT-5 系列全面超越

适合： 通用任务、长文档处理、历史项目兼容

GPT-4.1 Mini

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 经典轻量模型；兼容性好；价格极低

劣势： 深度推理有限；已是上一代

适合： 日常对话、简单问答、历史项目兼容

GPT-5.5 Pro

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐
性价比	⭐⭐
多模态	⭐⭐⭐⭐⭐

优势： OpenAI 最强推理模式；深度思考能力顶尖；适合最复杂的任务

劣势： 速度慢；价格最高；简单任务大材小用

适合： 极复杂推理、科研分析、高难度编程、数学证明

GPT-5 Mini

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： GPT-5 的轻量版；速度快价格低；日常够用

劣势： 深度推理有限

适合： 日常对话、轻量编程、高频任务

GPT-5.4 Nano

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐
编程能力	⭐⭐
创意写作	⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 最轻量的 GPT-5.4；极速极便宜

劣势： 仅适合最简单的任务

适合： 文本分类、格式转换、极简问答

GPT-OSS 120B

厂商： OpenAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： OpenAI 开源模型；可本地部署；性价比高

劣势： 不如闭源旗舰；中文和创意写作一般

适合： 本地部署、隐私敏感场景、成本优化

Grok 4.1 Fast

厂商： xAI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 快速响应；实时信息访问；推理能力不错

劣势： 中文和创意写作一般

适合： 快速问答、实时信息查询、日常编程

GLM-5

厂商： 智谱 AI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 中文深度理解顶尖；价格极低；长文本处理好

劣势： 英文能力不如国际模型；编程能力中等

适合： 中文长文本处理、知识问答、学术写作

GLM-5.1

厂商： 智谱 AI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 智谱最新旗舰；中文能力顶尖；编程能力提升明显

劣势： 英文场景不如国际模型

适合： 中文深度对话、编程辅助、内容创作

GLM-5 Turbo

厂商： 智谱 AI | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 极速响应；价格极低；中文日常任务表现好

劣势： 深度推理有限；复杂任务不适合

适合： 中文客服、高频轻量任务、成本敏感的批量处理

DeepSeek V3.2

厂商： DeepSeek | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 上一代主力；中文优秀；开源可部署；价格极低

劣势： 已被 V4 系列超越

适合： 中文对话、编程辅助、成本优化

DeepSeek R1

厂商： DeepSeek | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 深度推理增强模型；数学和逻辑能力强；开源

劣势： 响应较慢（思考链长）；创意写作一般

适合： 数学推理、逻辑分析、复杂问题求解

MiniMax M2.7 Highspeed

厂商： MiniMax | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐
编程能力	⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 中文多模态；极速响应；创意写作不错

劣势： 英文和编程能力有限

适合： 中文创意写作、多模态对话、高频中文任务

Claude Sonnet 4.5

厂商： Anthropic | 类型： 文本对话

维度	评分
推理能力	⭐⭐⭐⭐
编程能力	⭐⭐⭐⭐
创意写作	⭐⭐⭐⭐
中文表现	⭐⭐⭐⭐
响应速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 上一代 Sonnet；稳定可靠；性价比好

劣势： 已被 4.6 超越

适合： 日常编程、文档生成、通用任务

Gemini 3.1 Flash Image

厂商： Google | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐
文字渲染	⭐⭐⭐
风格多样性	⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： Gemini 原生图像生成；速度快；价格低

劣势： 精细度不如 GPT Image/Midjourney

适合： 快速概念图、插图生成、多模态创作

Gemini 3 Pro Image

厂商： Google | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐
文字渲染	⭐⭐⭐
风格多样性	⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 多模态图像生成；质量稳定；理解能力强

劣势： 艺术风格不如 Midjourney

适合： 图像生成、多模态创作、产品图

NIJI-7

厂商： Midjourney | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐⭐
动漫风格	⭐⭐⭐⭐⭐
角色设计	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： 二次元/动漫风格顶尖；角色设计出色；场景表现好

劣势： 仅适合动漫风格；写实场景不适合

适合： 动漫插画、角色设计、二次元内容创作

Imagen 4 Fast

厂商： Google | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐⭐⭐
文字渲染	⭐⭐⭐⭐
写实能力	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐

优势： Google 高质量文生图；写实能力强；速度快

劣势： 艺术风格不如 Midjourney

适合： 写实图像、产品图、广告素材

Z-Image Turbo

厂商： 通义 | 类型： 图像生成

维度	评分
图像质量	⭐⭐⭐
中文理解	⭐⭐⭐⭐⭐
生成速度	⭐⭐⭐⭐⭐
性价比	⭐⭐⭐⭐⭐

优势： 中文 prompt 理解好；速度极快；价格极低

劣势： 精细度不如国际模型

适合： 中文场景快速出图、批量生成

Grok Imagine Video

厂商： xAI | 类型： 视频生成

维度	评分
视频质量	⭐⭐⭐⭐
创意风格	⭐⭐⭐⭐⭐
动作自然度	⭐⭐⭐
生成速度	⭐⭐⭐⭐

优势： AI 想象力视频；创意风格独特；适合探索性创作

劣势： 写实场景不如 Sora；动作自然度有限

适合： 创意短片、概念视频、艺术探索

模型评分卡 ​

GPT-5 ​

Claude Sonnet 4.6 ​

Claude Opus 4.6 ​

Claude Opus 4.7 ​

Gemini 3.5 Flash ​

GPT-5.5 ​

Grok 4.3 ​

DeepSeek V4 Pro ​

DeepSeek V4 Flash ​

Gemini 3.1 Pro ​

GPT-5.4 ​

GPT-5.4 Mini ​

Grok 4.20 ​

Claude Haiku 4.5 ​

GPT Image 2 ​

Midjourney V7 ​

Seedance 2.0 ​

Sora 2 ​

GPT-4o ​

GPT-4o Mini ​

Gemini 3 Flash ​

Gemini 3.1 Flash Lite ​

Gemini 2.5 Pro ​

Gemini 2.5 Flash ​

GPT-4.1 ​

GPT-4.1 Mini ​

GPT-5.5 Pro ​

GPT-5 Mini ​

GPT-5.4 Nano ​

GPT-OSS 120B ​

Grok 4.1 Fast ​

GLM-5 ​

GLM-5.1 ​

GLM-5 Turbo ​

DeepSeek V3.2 ​

DeepSeek R1 ​

MiniMax M2.7 Highspeed ​

Claude Sonnet 4.5 ​

Gemini 3.1 Flash Image ​

Gemini 3 Pro Image ​

NIJI-7 ​

Imagen 4 Fast ​

Z-Image Turbo ​

Grok Imagine Video ​

模型评分卡

GPT-5

Claude Sonnet 4.6

Claude Opus 4.6

Claude Opus 4.7

Gemini 3.5 Flash

GPT-5.5

Grok 4.3

DeepSeek V4 Pro

DeepSeek V4 Flash

Gemini 3.1 Pro

GPT-5.4

GPT-5.4 Mini

Grok 4.20

Claude Haiku 4.5

GPT Image 2

Midjourney V7

Seedance 2.0

Sora 2

GPT-4o

GPT-4o Mini

Gemini 3 Flash

Gemini 3.1 Flash Lite

Gemini 2.5 Pro

Gemini 2.5 Flash

GPT-4.1

GPT-4.1 Mini

GPT-5.5 Pro

GPT-5 Mini

GPT-5.4 Nano

GPT-OSS 120B

Grok 4.1 Fast

GLM-5

GLM-5.1

GLM-5 Turbo

DeepSeek V3.2

DeepSeek R1

MiniMax M2.7 Highspeed

Claude Sonnet 4.5

Gemini 3.1 Flash Image

Gemini 3 Pro Image

NIJI-7

Imagen 4 Fast

Z-Image Turbo

Grok Imagine Video