Models - LLM 제공업체

Agno-Go는 통합 인터페이스로 여러 LLM 제공업체를 지원합니다.

지원 모델

OpenAI

GPT-4o, GPT-4o-mini, GPT-4 Turbo, GPT-3.5 Turbo
완전한 스트리밍 지원
함수 호출

Anthropic Claude

Claude 3.5 Sonnet, Claude 3 Opus, Claude 3 Sonnet, Claude 3 Haiku
스트리밍 지원
도구 사용

GLM (智谱AI) ⭐ v1.0.2에 추가됨

GLM-4, GLM-4V(비전), GLM-3-Turbo
중국어 최적화
사용자 정의 JWT 인증
함수 호출 지원

Ollama

로컬 모델 실행 (Llama, Mistral 등)
프라이버시 우선
API 비용 없음

OpenAI

설정

import "github.com/rexleimo/agno-go/pkg/agno/models/openai"

model, err := openai.New("gpt-4o-mini", openai.Config{
    APIKey:      os.Getenv("OPENAI_API_KEY"),
    Temperature: 0.7,
    MaxTokens:   1000,
})

구성

type Config struct {
    APIKey      string  // 필수: OpenAI API 키
    BaseURL     string  // 선택: 커스텀 엔드포인트 (기본값: https://api.openai.com/v1)
    Temperature float64 // 선택: 0.0-2.0 (기본값: 0.7)
    MaxTokens   int     // 선택: 최대 응답 토큰
}

지원 모델

모델	컨텍스트	최적 용도
`gpt-4o`	128K	가장 강력한, 멀티모달
`gpt-4o-mini`	128K	빠르고, 비용 효율적
`gpt-4-turbo`	128K	고급 추론
`gpt-3.5-turbo`	16K	간단한 작업, 빠름

예제

package main

import (
    "context"
    "fmt"
    "log"
    "os"

    "github.com/rexleimo/agno-go/pkg/agno/agent"
    "github.com/rexleimo/agno-go/pkg/agno/models/openai"
)

func main() {
    model, err := openai.New("gpt-4o-mini", openai.Config{
        APIKey:      os.Getenv("OPENAI_API_KEY"),
        Temperature: 0.7,
    })
    if err != nil {
        log.Fatal(err)
    }

    agent, _ := agent.New(agent.Config{
        Name:  "Assistant",
        Model: model,
    })

    output, _ := agent.Run(context.Background(), "Hello!")
    fmt.Println(output.Content)
}

Anthropic Claude

설정

import "github.com/rexleimo/agno-go/pkg/agno/models/anthropic"

model, err := anthropic.New("claude-3-5-sonnet-20241022", anthropic.Config{
    APIKey:    os.Getenv("ANTHROPIC_API_KEY"),
    MaxTokens: 2048,
})

구성

type Config struct {
    APIKey      string  // 필수: Anthropic API 키
    Temperature float64 // 선택: 0.0-1.0
    MaxTokens   int     // 선택: 최대 응답 토큰 (기본값: 4096)
}

지원 모델

모델	컨텍스트	최적 용도
`claude-3-5-sonnet-20241022`	200K	가장 지능적, 코딩
`claude-3-opus-20240229`	200K	복잡한 작업
`claude-3-sonnet-20240229`	200K	균형잡힌 성능
`claude-3-haiku-20240307`	200K	빠른 응답

예제

package main

import (
    "context"
    "fmt"
    "log"
    "os"

    "github.com/rexleimo/agno-go/pkg/agno/agent"
    "github.com/rexleimo/agno-go/pkg/agno/models/anthropic"
)

func main() {
    model, err := anthropic.New("claude-3-5-sonnet-20241022", anthropic.Config{
        APIKey:    os.Getenv("ANTHROPIC_API_KEY"),
        MaxTokens: 2048,
    })
    if err != nil {
        log.Fatal(err)
    }

    agent, _ := agent.New(agent.Config{
        Name:         "Claude",
        Model:        model,
        Instructions: "You are a helpful assistant.",
    })

    output, _ := agent.Run(context.Background(), "Explain quantum computing")
    fmt.Println(output.Content)
}

GLM (智谱AI)

설정

import "github.com/rexleimo/agno-go/pkg/agno/models/glm"

model, err := glm.New("glm-4", glm.Config{
    APIKey:      os.Getenv("ZHIPUAI_API_KEY"),  // 형식: {key_id}.{key_secret}
    Temperature: 0.7,
    MaxTokens:   1024,
})

구성

type Config struct {
    APIKey      string  // 필수: API 키, 형식은 {key_id}.{key_secret}
    BaseURL     string  // 선택: 사용자 정의 엔드포인트 (기본값: https://open.bigmodel.cn/api/paas/v4)
    Temperature float64 // 선택: 0.0-1.0
    MaxTokens   int     // 선택: 최대 응답 토큰 수
    TopP        float64 // 선택: Top-p 샘플링 매개변수
    DoSample    bool    // 선택: 샘플링 사용 여부
}

지원 모델

모델	컨텍스트	최적 용도
`glm-4`	128K	일반 대화, 중국어
`glm-4v`	128K	비전 작업, 멀티모달
`glm-3-turbo`	128K	빠른 응답, 비용 최적화

API 키 형식

GLM은 두 부분으로 구성된 특별한 API 키 형식을 사용합니다:

{key_id}.{key_secret}

API 키 발급처: https://open.bigmodel.cn/

예제

package main

import (
    "context"
    "fmt"
    "log"
    "os"

    "github.com/rexleimo/agno-go/pkg/agno/agent"
    "github.com/rexleimo/agno-go/pkg/agno/models/glm"
    "github.com/rexleimo/agno-go/pkg/agno/tools/calculator"
    "github.com/rexleimo/agno-go/pkg/agno/tools/toolkit"
)

func main() {
    model, err := glm.New("glm-4", glm.Config{
        APIKey:      os.Getenv("ZHIPUAI_API_KEY"),
        Temperature: 0.7,
        MaxTokens:   1024,
    })
    if err != nil {
        log.Fatal(err)
    }

    agent, _ := agent.New(agent.Config{
        Name:         "GLM 도우미",
        Model:        model,
        Toolkits:     []toolkit.Toolkit{calculator.New()},
        Instructions: "你是一个有用的 AI 助手。",
    })

    // 중국어 지원
    output, _ := agent.Run(context.Background(), "你好！请计算 123 * 456")
    fmt.Println(output.Content)
}

인증

GLM은 JWT(JSON Web Token) 인증을 사용합니다:

API 키가 key_id와 key_secret으로 파싱됩니다
HMAC-SHA256 서명을 사용하여 JWT 토큰을 생성합니다
토큰의 유효 기간은 7일입니다
요청마다 자동으로 재생성됩니다

모든 것이 SDK에 의해 자동으로 처리됩니다.

Ollama (로컬 모델)

설정

Ollama 설치: https://ollama.ai
모델 다운로드: ollama pull llama2
Agno-Go에서 사용:

import "github.com/rexleimo/agno-go/pkg/agno/models/ollama"

model, err := ollama.New("llama2", ollama.Config{
    BaseURL: "http://localhost:11434",  // Ollama 서버
})

구성

type Config struct {
    BaseURL     string  // 선택: Ollama 서버 URL (기본값: http://localhost:11434)
    Temperature float64 // 선택: 0.0-1.0
}

지원 모델

Ollama에서 사용 가능한 모든 모델:

llama2, llama3, llama3.1
mistral, mixtral
codellama, deepseek-coder
qwen2, gemma2

예제

package main

import (
    "context"
    "fmt"
    "log"

    "github.com/rexleimo/agno-go/pkg/agno/agent"
    "github.com/rexleimo/agno-go/pkg/agno/models/ollama"
)

func main() {
    // Ollama가 실행 중이고 모델이 다운로드되어 있는지 확인
    model, err := ollama.New("llama2", ollama.Config{
        BaseURL: "http://localhost:11434",
    })
    if err != nil {
        log.Fatal(err)
    }

    agent, _ := agent.New(agent.Config{
        Name:  "Local Assistant",
        Model: model,
    })

    output, _ := agent.Run(context.Background(), "What is Go?")
    fmt.Println(output.Content)
}

모델 비교

성능

제공업체	속도	비용	프라이버시	컨텍스트
OpenAI GPT-4o-mini	⚡⚡⚡	💰	☁️ 클라우드	128K
OpenAI GPT-4o	⚡⚡	💰💰💰	☁️ 클라우드	128K
Anthropic Claude	⚡⚡	💰💰	☁️ 클라우드	200K
GLM-4	⚡⚡⚡	💰	☁️ 클라우드	128K
Ollama	⚡	🆓 무료	🏠 로컬	다양

각 모델 사용 시기

OpenAI GPT-4o-mini

개발 및 테스트
대용량 애플리케이션
비용에 민감한 사용 사례

OpenAI GPT-4o

복잡한 추론 작업
멀티모달 애플리케이션
프로덕션 시스템

Anthropic Claude

긴 컨텍스트 필요 (200K 토큰)
코딩 지원
복잡한 분석

GLM-4

중국어 애플리케이션
중국 내 배포 요구사항
빠른 응답과 높은 품질
중국 사용자를 위한 비용 최적화

Ollama

프라이버시 요구사항
인터넷 연결 없음
API 비용 제로
개발/테스트

모델 전환

모델 전환은 쉽습니다:

// OpenAI
openaiModel, _ := openai.New("gpt-4o-mini", openai.Config{
    APIKey: os.Getenv("OPENAI_API_KEY"),
})

// Claude
claudeModel, _ := anthropic.New("claude-3-5-sonnet-20241022", anthropic.Config{
    APIKey: os.Getenv("ANTHROPIC_API_KEY"),
})

// GLM
glmModel, _ := glm.New("glm-4", glm.Config{
    APIKey: os.Getenv("ZHIPUAI_API_KEY"),
})

// Ollama
ollamaModel, _ := ollama.New("llama2", ollama.Config{})

// 동일한 에이전트 코드 사용
agent, _ := agent.New(agent.Config{
    Model: openaiModel,  // 또는 claudeModel, glmModel, ollamaModel
})

Timeout 구성

개요

모델 타임아웃 구성을 통해 LLM API 호출의 최대 대기 시간을 제어할 수 있습니다.

지원 모델

✅ OpenAI - 모든 모델
✅ Anthropic Claude - 모든 모델
⏳ GLM - 곧 지원 예정
⏳ Ollama - 곧 지원 예정

기본 설정

기본 타임아웃: 60초
최소값: 1초
최대값: 10분 (600초)

사용 방법

OpenAI

import "github.com/rexleimo/agno-go/pkg/agno/models/openai"

model, err := openai.New("gpt-4", openai.Config{
    APIKey:  os.Getenv("OPENAI_API_KEY"),
    Timeout: 30 * time.Second,  // 30초 타임아웃
})

Anthropic Claude

import "github.com/rexleimo/agno-go/pkg/agno/models/anthropic"

model, err := anthropic.New("claude-3-5-sonnet-20241022", anthropic.Config{
    APIKey:  os.Getenv("ANTHROPIC_API_KEY"),
    Timeout: 45 * time.Second,  // 45초 타임아웃
})

모범 사례

1. 사용 사례에 따라 조정

// 간단한 작업: 짧은 타임아웃
quickModel, _ := openai.New("gpt-4o-mini", openai.Config{
    Timeout: 15 * time.Second,
})

// 복잡한 작업: 긴 타임아웃
complexModel, _ := openai.New("gpt-4", openai.Config{
    Timeout: 120 * time.Second,
})

2. 프로덕션 환경

// 프로덕션 환경에서 적절한 타임아웃 설정
prodModel, _ := openai.New("gpt-4", openai.Config{
    APIKey:  os.Getenv("OPENAI_API_KEY"),
    Timeout: 60 * time.Second,  // 1분
})

3. 오류 처리

output, err := agent.Run(ctx, input)
if err != nil {
    if errors.Is(err, context.DeadlineExceeded) {
        log.Println("Request timed out")
    } else {
        log.Printf("Request failed: %v", err)
    }
}

고급 구성

Temperature

무작위성 제어 (0.0 = 결정론적, 1.0+ = 창의적):

model, _ := openai.New("gpt-4o-mini", openai.Config{
    Temperature: 0.0,  // 일관된 응답
})

model, _ := openai.New("gpt-4o-mini", openai.Config{
    Temperature: 1.5,  // 창의적인 응답
})

Max Tokens

응답 길이 제한:

model, _ := openai.New("gpt-4o-mini", openai.Config{
    MaxTokens: 500,  // 짧은 응답
})

커스텀 엔드포인트

호환 가능한 API 사용:

model, _ := openai.New("gpt-4o-mini", openai.Config{
    BaseURL: "https://your-proxy.com/v1",  // 커스텀 엔드포인트
    APIKey:  "your-key",
})

모범 사례

1. 환경 변수

API 키를 안전하게 저장:

// 좋음 ✅
APIKey: os.Getenv("OPENAI_API_KEY")

// 나쁨 ❌
APIKey: "sk-proj-..." // 하드코딩

2. 오류 처리

항상 오류 확인:

model, err := openai.New("gpt-4o-mini", openai.Config{
    APIKey: os.Getenv("OPENAI_API_KEY"),
})
if err != nil {
    log.Fatalf("Failed to create model: %v", err)
}

3. 모델 선택

필요에 따라 선택:

// 개발: 빠르고 저렴
devModel, _ := openai.New("gpt-4o-mini", config)

// 프로덕션: 더 강력함
prodModel, _ := openai.New("gpt-4o", config)

4. 컨텍스트 관리

컨텍스트 제한에 주의:

// 긴 대화의 경우, 주기적으로 메모리 지우기
if messageCount > 50 {
    agent.ClearMemory()
}

환경 설정

.env 파일 생성:

bash

# OpenAI
OPENAI_API_KEY=sk-proj-...

# Anthropic
ANTHROPIC_API_KEY=sk-ant-...

# GLM (智谱AI) - 형식: {key_id}.{key_secret}
ZHIPUAI_API_KEY=your-key-id.your-key-secret

# Ollama (선택, 기본값은 localhost)
OLLAMA_BASE_URL=http://localhost:11434

코드에서 로드:

import "github.com/joho/godotenv"

func init() {
    godotenv.Load()
}

다음 단계

모델 능력 향상을 위한 Tools 추가
대화 히스토리를 위한 Memory 배우기
혼합 모델로 Teams 구축
실제 사용을 위한 Examples 탐색

Models - LLM 제공업체 ​

지원 모델 ​

OpenAI ​

Anthropic Claude ​

GLM (智谱AI) ⭐ v1.0.2에 추가됨 ​

Ollama ​

OpenAI ​

설정 ​

구성 ​

지원 모델 ​

예제 ​

Anthropic Claude ​

설정 ​

구성 ​

지원 모델 ​

예제 ​

GLM (智谱AI) ​

설정 ​

구성 ​

지원 모델 ​

API 키 형식 ​

예제 ​

인증 ​

Ollama (로컬 모델) ​

설정 ​

구성 ​

지원 모델 ​

예제 ​

모델 비교 ​

성능 ​

각 모델 사용 시기 ​

모델 전환 ​

Timeout 구성 ​

개요 ​

지원 모델 ​

기본 설정 ​

사용 방법 ​

OpenAI ​

Anthropic Claude ​

모범 사례 ​

1. 사용 사례에 따라 조정 ​

2. 프로덕션 환경 ​

3. 오류 처리 ​

고급 구성 ​

Temperature ​

Max Tokens ​

커스텀 엔드포인트 ​

모범 사례 ​

1. 환경 변수 ​

2. 오류 처리 ​

3. 모델 선택 ​

4. 컨텍스트 관리 ​

환경 설정 ​

다음 단계 ​

관련 예제 ​

Models - LLM 제공업체

지원 모델

OpenAI

Anthropic Claude

GLM (智谱AI) ⭐ v1.0.2에 추가됨

Ollama

OpenAI

설정

구성

지원 모델

예제

Anthropic Claude

설정

구성

지원 모델

예제

GLM (智谱AI)

설정

구성

지원 모델

API 키 형식

예제

인증

Ollama (로컬 모델)

설정

구성

지원 모델

예제

모델 비교

성능

각 모델 사용 시기

모델 전환

Timeout 구성

개요

지원 모델

기본 설정

사용 방법

OpenAI

Anthropic Claude

모범 사례

1. 사용 사례에 따라 조정

2. 프로덕션 환경

3. 오류 처리

고급 구성

Temperature

Max Tokens

커스텀 엔드포인트

모범 사례

1. 환경 변수

2. 오류 처리

3. 모델 선택

4. 컨텍스트 관리

환경 설정

다음 단계

관련 예제