帮我分析一下gpt o4mini和gemini2.5 flash 的区别,对比参数和官方的api价格

作成日: 2025年5月2日

使用モデル O4 Mini High by Chat01

質問

帮我分析一下gpt o4mini和gemini2.5 flash 的区别,对比参数和官方的api价格

思考

Confirming GPT-4 Mini Context Window

The OpenAI article confirms that GPT-4 Mini has a context window of 128K tokens with a 16K output token limit, covering knowledge until October 2023. However, the parameter count isn't disclosed publicly. While we might refer to Wikipedia, it doesn't mention the parameter count either. We can note this, citing the official sources and clarifying that parameter counts for GPT-4 Mini are not publicly available.

Summarizing Model Comparison

Both models have undisclosed parameter counts.

Summary:

  • GPT-4o Mini, released on July 18, 2024, handles text and vision with a 128K token context window and up to 16K output tokens.
  • Gemini 2.5 Flash, released on April 17, 2025, supports a 1M token context window, with text, images, audio, and video. It has an adjustable thinking budget.

Price:

  • GPT-4o Mini: 1.10perMtokensforinput,1.10 per M tokens for input, 4.40 per M for output.
  • Gemini 2.5 Flash: 0.15perMforinput,0.15 per M for input, 0.60 for non-thinking, $3.50 thinking output.

Citations required for each claim.

Thought for 1m 33s

回答

以下是对 GPT-4o mini(又称 o4-mini)和 Gemini 2.5 Flash 在模型规格与官方 API 定价方面的详细对比。

在参数规模方面,两者均未公开具体的模型参数数量(即权重规模) Wikipedia Google DeepMind
GPT-4o mini 是 OpenAI 于 2024 年 7 月 18 日发布的一款小型推理模型,支持文本与视觉输入,拥有 128 K 的上下文窗口和最多 16 K 输出令牌;官方定价为每 1 M 输入令牌 0.15、每1M输出令牌0.15、每 1 M 输出令牌 0.60 OpenAI OpenAI
Gemini 2.5 Flash 则是 Google 于 2025 年 4 月 17 日推出的首款混合推理模型,支持文本、图像、音频与视频输入,拥有 1 M 的上下文窗口,并可通过 thinking_budget 参数在 0 – 24 576 令牌范围内调节内部“思考”量;付费版定价为每 1 M 文本/图像/视频输入令牌 0.15、非思考输出令牌0.15、非思考输出令牌 0.60、思考输出令牌 $3.50 Home- Google Developers Blog Google AI for Developers

GPT-4o mini(o4-mini)规格概览

  • 发布时间:2024 年 7 月 18 日 OpenAI
  • 支持模态:文本 + 视觉 OpenAI
  • 模型参数量:官方未公开 Wikipedia
  • 上下文窗口:128 K tokens;输出上限 16 K tokens OpenAI
  • API 接入:Assistants API、Chat Completions API、Batch API OpenAI

Gemini 2.5 Flash 规格概览

官方 API 定价对比

模型API 类型输入价 (per 1 M tokens)缓存输入价 (per 1 M tokens)输出价 (per 1 M tokens)
GPT-4o miniChat Completions API$1.100$0.275$4.400 OpenAI
GPT-4o miniRealtime API$0.60$0.30$2.40 OpenAI
Gemini 2.5 FlashGemini Developer API(付费版)0.15(text/image/video)<br>0.15 (text/image/video)<br>1.00 (audio)0.60(非思考)<br>0.60 (非思考)<br>3.50 (思考) Google AI for Developers

说明

  • GPT-4o mini 的定价数据来源于 OpenAI 官方 “API Pricing” 页面 OpenAI
  • Gemini 2.5 Flash 支持免费额度(Free Tier)和付费额度(Paid Tier);上述价格为付费额度的按 1 M tokens 计费标准 Google AI for Developers
  • 缓存输入价(Cached input)指在短时间内重复提交相同上下文时可能享有的折扣价。

结论

  • 性能与成本:GPT-4o mini 在学术基准测试中的表现优异,适合对延迟敏感且需兼顾多模态(文本+视觉)的场景;Gemini 2.5 Flash 则凭借 1 M tokens 超大上下文和可调思考预算,适合需要极长上下文或多模态融合(含音视频)以及对推理深度有精细控制的高复杂度任务。
  • 定价对比:两者在文本/视觉输入场景下单价相近,但 Gemini 2.5 Flash 在启用思考模式时输出成本明显高于 GPT-4o mini;若主要关注非思考场景,则两者输入/输出成本均较为接近。
  • 未公开参数量:两家公司均未披露具体的模型参数规模,若对模型大小敏感,可关注未来 OpenAI 和 Google 发布的系统卡或官方技术文档。

以上对比可帮助您在不同应用需求下,结合性能指标和成本预算,选择最合适的模型及 API。

このQ&Aを共有