g3/crates/g3-config/src/tests.rs at 155db74aac085f9d0aebf58cb81a497f0eba2b8b

alex/g3

Files

Dhanji R. Prasanna 01cb4f6691 fix: use consistent max_tokens defaults across providers

- Fix aliasing issue where resolve_max_tokens() used fallback_default_max_tokens
  (8192) instead of provider-specific defaults
- Update fallback_default_max_tokens from 8192 to 32000
- Set provider-specific max_tokens defaults:
  - Anthropic: 32000
  - OpenAI: 32000 (was 16000)
  - Databricks: 32000 (was 50000, now matches Anthropic as passthru)
  - Embedded: 2048
- Context window lengths unchanged:
  - OpenAI: 400,000
  - Anthropic: 200,000
  - Databricks (Claude): 200,000

This fixes the 'LLM response was cut off due to max_tokens limit' error
in agent mode that occurred because 8192 was being used instead of 32000.

2026-01-16 07:05:57 +05:30

8.2 KiB

Raw Blame History

View Raw

8.2 KiB Raw Blame History

8.2 KiB

Raw Blame History