google Gemma 3 27B 这个模型是不是免费的?怎么调用它的api? curl怎么创建...
作成日: 2025年6月19日
作成日: 2025年6月19日
google Gemma 3 27B
这个模型是不是免费的?怎么调用它的api?
curl怎么创建?
场景 | 成本 | 备注 |
---|---|---|
本地/私有云推理 | 模型权重免费——Gemma 3 27B 以开放权重发布,可从 Hugging Face、Ollama 等处直接下载。你只为算力买单。huggingface.co | |
Google Gemini API(官方托管) | 完全免费(Free Tier):输入 / 输出 / 缓存 都是 0 美元;但有速率限制。ai.google.dev | |
第三方聚合/推理服务 <br>(OpenRouter、Together AI 等) | 取决于各平台:<br>· OpenRouter 提供 google/gemma-3-27b-it:free 版本——0 美元/Token,日配额有限。openrouter.ai <br>· 付费版或 Together AI 专用端点按 Token 计费。 |
小贴士
- 免费层会在高并发时出现
429 RESOURCE_EXHAUSTED
,记得关注配额仪表盘。- 中国大陆目前仍无法直接调用 Gemini API,需要走代理或使用第三方服务商。
bashexport GEMINI_API_KEY="你的 Key" curl -X POST \ -H "Authorization: Bearer ${GEMINI_API_KEY}" \ -H "Content-Type: application/json" \ "https://generativelanguage.googleapis.com/v1beta/models/gemma-3-27b-it:generateContent" \ -d '{ "contents": [{ "role": "user", "parts": [{ "text": "用五十字解释什么是量子纠缠" }] }] }'
要点
字段 | 说明 |
---|---|
URL | .../models/gemma-3-27b-it:generateContent (模型 ID 即 gemma-3-27b-it )ai.google.dev |
Authorization | Bearer + API Key(不是 OAuth 令牌) |
contents | 与 ChatGPT 一样的角色结构:role + parts 。 |
速率限制 | 免费层默认 ~60 RPM,每日总 Tokens≈100 K(官方会调整)。 |
若需流式输出,把路径换成
:streamGenerateContent
并逐块读取 SSE。
bashexport OPENROUTER_API_KEY="你的 OpenRouter Key" curl https://openrouter.ai/api/v1/chat/completions \ -H "Authorization: Bearer ${OPENROUTER_API_KEY}" \ -H "Content-Type: application/json" \ -d '{ "model": "google/gemma-3-27b-it:free", "messages": [ { "role": "user", "content": "写一段介绍机器学习的短文" } ] }'
base_url
指向 https://openrouter.ai/api/v1
.bashollama run gemma3:27b
一台 24 GB 显存卡即可跑 4-bit 量化版,且离线、不限速。ollama.com
FAILED_PRECONDITION
通常是区域不在白名单。400 BAD_REQUEST
,记得截断。data:
URL 或走 File API,不支持直接 multipart 上传。结论:
- 权重层面真正免费;
- 官方托管在“Free Tier”内完全 0 成本,只要你能接受速率上限;
- 生产级流量可选择开通 Gemini API 付费层、Vertex AI,或第三方专用端点。祝玩得开心!