Prompt Trimmer
Uzun promptları token bütçesine indir — sınır bilinçli; sohbet geçmişi, doküman QA ve kod incelemesi için stratejiler.
Prompt girdisi
Bir prompt yapıştır, öncelikli paragrafları işaretle, sonra strateji seç.
Öncelik işaretleme modu
Paragrafları yüksek (koru) veya düşük (önce kırp) olarak işaretle.
Kırpma ayarları
Bütçeyi, stratejiyi ve neyin korunacağını seç.
Şablon
Strateji
Ortadan dışa doğru tam paragraflar atar.
Hedef token bütçesi
Çıktı için ayır
Modelin yanıt için yer bulabilmesi için bütçeden düşülür.
Korunacak yapılar
Başlıklar (#, ##)
Kod blokları (```)
Listeler (-, *, 1.)
Alıntı blokları (>)
Satır içi kod (`)
Kırpma işareti ekle
İçeriğin atıldığı yerlere [... 234 token kırpıldı ...] gibi işaret koy.
Kırpılmış çıktı
Anlık güncellenir. Nelerin atıldığını görmek için diff'i aç.
832 → 832
832
Kazanım
0%
Korunan
100%
Karşılaştırmak için bir snapshot kaydet.
İçerik türüne göre token başına karakter
| İçerik türü | Karakter/token | Notlar |
|---|---|---|
| İngilizce düz yazı | ≈ 4 | Sohbet metni için varsayılan |
| Kod | ≈ 3 | Yoğun noktalama daha sık tokenize olur |
| CJK (中日韓) | ≈ 2 | Bir token çoğu zaman 1–2 glif |
| Sayı / ID | ≈ 2.5 | Rakam yoğun dizgiler sıkı tokenize olur |
| URL | ≈ 3 | Çok fazla noktalama |
Yaygın bütçe biçimleri
- Kısa sistem promptu: 200–600 token.
- RAG bağlamı: istek başı 2k–8k.
- Bir bölüm üzerinde QA: 8k–32k.
- Tüm kod tabanı bağlamı: 100k–1M (Gemini, Claude uzun).
- Modelin yanıtı için 300–800 token ayır.
Maliyet notu
Promptu 1k token kısaltmak, 1M input başına 3$ olan bir modelde çağrı başına ~0,003$ kazandırır — her çağrıyla katlanır.
AI maliyet tahminleyicisini aç →Token sayıları yaklaşıktır. Gerçek tokenizer'lar modele göre değişir — bunları planlama için kullan, faturalandırma için değil.