Supported Providers

Saiki supports multiple LLM providers out-of-the-box, plus the ability to use any OpenAI SDK-compatible provider.

Default Providers

OpenAI

llm:
  provider: openai
  model: gpt-4.1-mini  # Default
  apiKey: $OPENAI_API_KEY

Supported models: gpt-4.1, gpt-4.1-mini, gpt-4.1-nano, gpt-4o, gpt-4o-mini, o4-mini, o3, o3-mini, o1

Anthropic

llm:
  provider: anthropic
  model: claude-4-sonnet-20250514 # Default
  apiKey: $ANTHROPIC_API_KEY

Supported models: claude-4-opus-20250514, claude-4-sonnet-20250514, claude-3-7-sonnet-20250219, claude-3-5-sonnet-20240620, claude-3-haiku-20240307, claude-3-opus-20240229, claude-3-sonnet-20240229

Google

llm:
  provider: google
  model: gemini-2.5-pro-exp-03-25  # Default
  apiKey: $GOOGLE_GENERATIVE_AI_API_KEY

Supported models: gemini-2.5-pro-exp-03-25, gemini-2.5-flash-preview-05-20, gemini-2.0-flash, gemini-2.0-flash-lite, gemini-1.5-pro-latest, gemini-1.5-flash-latest

Groq

llm:
  provider: groq
  model: llama-3.3-70b-versatile  # Default
  apiKey: $GROQ_API_KEY

Supported models: gemma-2-9b-it, llama-3.3-70b-versatile

Custom/OpenAI-Compatible Providers

You can use any provider that implements the OpenAI SDK interface by setting provider: openai and providing a custom baseURL:

llm:
  provider: openai
  model: your-custom-model
  apiKey: $YOUR_API_KEY
  baseURL: https://api.your-provider.com/v1
  maxTokens: 100000  # Required for custom providers

Popular Compatible Providers

Local Models

Run models locally using Ollama, LM Studio, or similar:

llm:
  provider: openai
  model: llama3.2
  apiKey: dummy  # Required but ignored for local
  baseURL: http://localhost:11434/v1  # Ollama default
  maxTokens: 8000

Popular local model options:

Ollama: Easy local model hosting
LM Studio: User-friendly local interface
vLLM: High-performance serving
TGI (Text Generation Inference): Hugging Face's serving solution

Azure OpenAI

llm:
  provider: openai
  model: gpt-4
  apiKey: $AZURE_OPENAI_API_KEY
  baseURL: https://your-resource.openai.azure.com/openai/deployments/gpt-4
  maxTokens: 128000

Setup notes:

Replace your-resource with your Azure resource name
The model name should match your deployment name
Supports all OpenAI models available in Azure

OpenRouter

Access 100+ models through one API:

llm:
  provider: openai
  model: anthropic/claude-3.5-sonnet
  apiKey: $OPENROUTER_API_KEY
  baseURL: https://openrouter.ai/api/v1
  maxTokens: 200000

Popular OpenRouter models:

anthropic/claude-3.5-sonnet
meta-llama/llama-3.1-405b-instruct
google/gemini-pro-1.5
mistralai/mistral-large

Together.ai

llm:
  provider: openai
  model: meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo
  apiKey: $TOGETHER_API_KEY
  baseURL: https://api.together.xyz/v1
  maxTokens: 8000

Popular Together.ai models:

meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo
mistralai/Mixtral-8x7B-Instruct-v0.1
NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO

Anyscale

llm:
  provider: openai
  model: meta-llama/Llama-2-70b-chat-hf
  apiKey: $ANYSCALE_API_KEY
  baseURL: https://api.endpoints.anyscale.com/v1
  maxTokens: 4000

Perplexity

llm:
  provider: openai
  model: llama-3.1-sonar-huge-128k-online
  apiKey: $PERPLEXITY_API_KEY
  baseURL: https://api.perplexity.ai
  maxTokens: 128000

Special feature: Online models that can search the web in real-time.

Environment Variables

Set API keys in your .env file:

# Built-in providers
OPENAI_API_KEY=your_openai_key
ANTHROPIC_API_KEY=your_anthropic_key
GOOGLE_GENERATIVE_AI_API_KEY=your_google_key
GROQ_API_KEY=your_groq_key

# Custom providers
OPENROUTER_API_KEY=your_openrouter_key
TOGETHER_API_KEY=your_together_key
AZURE_OPENAI_API_KEY=your_azure_key
ANYSCALE_API_KEY=your_anyscale_key
PERPLEXITY_API_KEY=your_perplexity_key

Provider-Specific Features

OpenAI

Function calling: Excellent tool use capabilities
Streaming: Real-time response streaming
Vision: GPT-4o models support image inputs
JSON mode: Structured output generation

Anthropic

Large context: Up to 200K tokens
Tool use: Advanced function calling
Safety: Built-in content filtering
Constitutional AI: Helpful, harmless, honest responses

Google

Multimodal: Text, image, video, and audio inputs
Large context: Up to 2M tokens
Fast inference: Optimized for speed
Code generation: Excellent programming capabilities

Groq

Ultra-fast inference: Fastest API responses
Cost-effective: Competitive pricing
Open source models: Access to Llama and other OSS models

Choosing the Right Provider

For Development

OpenAI: Best overall developer experience and documentation
Local models: Free, private, and great for experimentation

For Production

OpenAI: Reliable, well-documented, extensive model selection
Anthropic: Excellent for safety-critical applications
Google: Best for multimodal and large context applications

For Cost Optimization

Groq: Fastest and often cheapest for compatible models
OpenRouter: Compare prices across providers
Local hosting: No per-token costs after setup

For Privacy

Local models: Complete data privacy
Azure OpenAI: Enterprise-grade security and compliance

Troubleshooting

Common Issues

Invalid API Key

# Make sure environment variable is set correctly
apiKey: $OPENAI_API_KEY  # Not: OPENAI_API_KEY

Model Not Found

Check the model name exactly matches provider documentation
Verify your API key has access to the requested model

Rate Limiting

Built-in providers have automatic retry logic
For custom providers, consider implementing retry logic

Timeout Issues

Increase timeout settings in providerOptions
Consider using a different model or provider

Getting Help

Check the model name: Ensure it exactly matches the provider's documentation
Verify API keys: Make sure environment variables are properly set
Test with curl: Verify your API key works with direct API calls
Check quotas: Ensure you haven't exceeded rate limits or billing quotas

Next Steps

Configure your chosen provider: Use the Configuration Reference for detailed setup
Start building: Head to Building with Saiki to create your first agent
Add tools: Learn about MCP Server Configuration to give your agent capabilities

Default Providers​

OpenAI​

Anthropic​

Google​

Groq​

Custom/OpenAI-Compatible Providers​

Popular Compatible Providers​

Local Models​

Azure OpenAI​

OpenRouter​

Together.ai​

Anyscale​

Perplexity​

Environment Variables​

Provider-Specific Features​

OpenAI​

Anthropic​

Google​

Groq​

Choosing the Right Provider​

For Development​

For Production​

For Cost Optimization​

For Privacy​

Troubleshooting​

Common Issues​

Getting Help​

Next Steps​

Default Providers

OpenAI

Anthropic

Google

Groq

Custom/OpenAI-Compatible Providers

Popular Compatible Providers

Local Models

Azure OpenAI

OpenRouter

Together.ai

Anyscale

Perplexity

Environment Variables

Provider-Specific Features

OpenAI

Anthropic

Google

Groq

Choosing the Right Provider

For Development

For Production

For Cost Optimization

For Privacy

Troubleshooting

Common Issues

Getting Help

Next Steps