free-llm-api-resources

Free LLM API resources

This lists various services that provide free access or credits towards API-based LLM usage.

[!NOTE]
Please don’t abuse these services, else we might lose them.

[!WARNING]
This list explicitly excludes any services that are not legitimate (eg reverse engineers an existing chatbot)

Free Providers
Providers with trial credits

Free Providers

OpenRouter

Limits:

20 requests/minute
50 requests/day
Up to 1000 requests/day with $10 lifetime topup

Models share a common quota.

Google AI Studio

Data is used for training when used outside of the UK/CH/EEA/EU.

Model Name	Model Limits
Gemini 3 Flash	250,000 tokens/minute 20 requests/day 5 requests/minute
Gemini 3.1 Flash-Lite	250,000 tokens/minute 500 requests/day 15 requests/minute
Gemini 2.5 Flash	250,000 tokens/minute 20 requests/day 5 requests/minute
Gemini 2.5 Flash-Lite	250,000 tokens/minute 20 requests/day 10 requests/minute
Gemma 3 27B Instruct	15,000 tokens/minute 14,400 requests/day 30 requests/minute
Gemma 3 12B Instruct	15,000 tokens/minute 14,400 requests/day 30 requests/minute
Gemma 3 4B Instruct	15,000 tokens/minute 14,400 requests/day 30 requests/minute
Gemma 3 1B Instruct	15,000 tokens/minute 14,400 requests/day 30 requests/minute

NVIDIA NIM

Phone number verification required. Models tend to be context window limited.

Limits: 40 requests/minute

Various open models

Mistral (La Plateforme)

Free tier (Experiment plan) requires opting into data training
Requires phone number verification.

Limits (per-model): 1 request/second, 500,000 tokens/minute, 1,000,000,000 tokens/month

Open and Proprietary Mistral models

Mistral (Codestral)

Currently free to use
Monthly subscription based
Requires phone number verification

Limits: 30 requests/minute, 2,000 requests/day

Codestral

HuggingFace Inference Providers

HuggingFace Serverless Inference limited to models smaller than 10GB. Some popular models are supported even if they exceed 10GB.

Limits: $0.10/month in credits

Various open models across supported providers

Vercel AI Gateway

Routes to various supported providers.

Limits: $5/month

OpenCode Zen

AI gateway with curated models.

Free models may use data for improvement.

Big Pickle Stealth
MiniMax M2.5 Free
Arcee Large Preview Free

Cerebras

Model Name	Model Limits
gpt-oss-120b	30 requests/minute 60,000 tokens/minute 900 requests/hour 1,000,000 tokens/hour 14,400 requests/day 1,000,000 tokens/day
Llama 3.1 8B	30 requests/minute 60,000 tokens/minute 900 requests/hour 1,000,000 tokens/hour 14,400 requests/day 1,000,000 tokens/day

Groq

Model Name	Model Limits
Allam 2 7B	7,000 requests/day 6,000 tokens/minute
Llama 3.1 8B	14,400 requests/day 6,000 tokens/minute
Llama 3.3 70B	1,000 requests/day 12,000 tokens/minute
Llama 4 Maverick 17B 128E Instruct	1,000 requests/day 6,000 tokens/minute
Llama 4 Scout Instruct	1,000 requests/day 30,000 tokens/minute
Whisper Large v3	7,200 audio-seconds/minute 2,000 requests/day
Whisper Large v3 Turbo	7,200 audio-seconds/minute 2,000 requests/day
canopylabs/orpheus-arabic-saudi
canopylabs/orpheus-v1-english
groq/compound	250 requests/day 70,000 tokens/minute
groq/compound-mini	250 requests/day 70,000 tokens/minute
meta-llama/llama-guard-4-12b	14,400 requests/day 15,000 tokens/minute
meta-llama/llama-prompt-guard-2-22m
meta-llama/llama-prompt-guard-2-86m
moonshotai/kimi-k2-instruct	1,000 requests/day 10,000 tokens/minute
moonshotai/kimi-k2-instruct-0905	1,000 requests/day 10,000 tokens/minute
openai/gpt-oss-120b	1,000 requests/day 8,000 tokens/minute
openai/gpt-oss-20b	1,000 requests/day 8,000 tokens/minute
openai/gpt-oss-safeguard-20b	1,000 requests/day 8,000 tokens/minute
qwen/qwen3-32b	1,000 requests/day 6,000 tokens/minute

Cohere

Limits:

20 requests/minute
1,000 requests/month

Models share a common monthly quota.

c4ai-aya-expanse-32b
c4ai-aya-vision-32b
command-a-03-2025
command-a-reasoning-08-2025
command-a-translate-08-2025
command-a-vision-07-2025
command-r-08-2024
command-r-plus-08-2024
command-r7b-12-2024
command-r7b-arabic-02-2025
tiny-aya-earth
tiny-aya-fire
tiny-aya-global
tiny-aya-water

GitHub Models

Extremely restrictive input/output token limits.

Limits: Dependent on Copilot subscription tier (Free/Pro/Pro+/Business/Enterprise)

Cloudflare Workers AI

Limits: 10,000 neurons/day

</tbody></table>

Providers with trial credits

Fireworks

Credits: $1

Models: Various open models

Baseten

Credits: $30

Models: Any supported model - pay by compute time

Nebius

Credits: $1

Models: Various open models

Novita

Credits: $0.5 for 1 year

Models: Various open models

AI21

Credits: $10 for 3 months

Models: Jamba family of models

Upstage

Credits: $10 for 3 months

Models: Solar Pro/Mini

NLP Cloud

Credits: $15

Requirements: Phone number verification

Models: Various open models

Alibaba Cloud (International) Model Studio

Credits: 1 million tokens/model

Models: Various open and proprietary Qwen models

Credits: $5/month upon sign up, $30/month with payment method added

Models: Any supported model - pay by compute time

Inference.net

Credits: $1, $25 on responding to email survey

Models: Various open models

Hyperbolic

Credits: $1

Models:

DeepSeek V3
DeepSeek V3 0324
Llama 3.1 405B Base
Llama 3.1 405B Instruct
Llama 3.1 8B Instruct
Llama 3.2 3B Instruct
Llama 3.3 70B Instruct
Pixtral 12B (2409)
Qwen QwQ 32B
Qwen2.5 72B Instruct
Qwen2.5 Coder 32B Instruct
Qwen2.5 VL 72B Instruct
Qwen2.5 VL 7B Instruct
deepseek-ai/deepseek-r1-0528
openai/gpt-oss-120b
openai/gpt-oss-120b-turbo
openai/gpt-oss-20b
qwen/qwen3-235b-a22b
qwen/qwen3-235b-a22b-instruct-2507
qwen/qwen3-coder-480b-a35b-instruct
qwen/qwen3-next-80b-a3b-instruct
qwen/qwen3-next-80b-a3b-thinking

SambaNova Cloud

Credits: $5 for 3 months

Models:

E5-Mistral-7B-Instruct
Llama 3.1 8B
Llama 3.3 70B
Llama 3.3 70B
Llama-4-Maverick-17B-128E-Instruct
Qwen/Qwen3-235B
Qwen/Qwen3-32B
Whisper-Large-v3
deepseek-ai/DeepSeek-R1-0528
deepseek-ai/DeepSeek-R1-Distill-Llama-70B
deepseek-ai/DeepSeek-V3-0324
deepseek-ai/DeepSeek-V3.1
deepseek-ai/DeepSeek-V3.1-Terminus
deepseek-ai/DeepSeek-V3.2
minimaxai/minimax-m2.5
openai/gpt-oss-120b
tbd

Scaleway Generative APIs

Credits: 1,000,000 free tokens

Models:

BGE-Multilingual-Gemma2
DeepSeek R1 Distill Llama 70B
Gemma 3 27B Instruct
Llama 3.1 8B Instruct
Llama 3.3 70B Instruct
Mistral Nemo 2407
Pixtral 12B (2409)
Whisper Large v3
devstral-2-123b-instruct-2512
gpt-oss-120b
holo2-30b-a3b
mistral-small-3.2-24b-instruct-2506
qwen3-235b-a22b-instruct-2507
qwen3-coder-30b-a3b-instruct
qwen3-embedding-8b
voxtral-small-24b-2507