Kako uštedeti tokene?
Štednja tokena (vidi 👉 Šta su tokeni?) je ključna veština, naročito kada koristmo modele na srpskom jeziku ("porez na jezik"). Evo konkretnih tehnika kako da smanjiš potrošnju, a zadržiš kvalitet.
Fokusiraćemo se na dva dela: Input (ono što ti šaljemo) i Output (ono što model vraća).
1. "Porez na pristojnost" (Budi robot)
Modeli nemaju osećanja. Reči poput "molim te", "da li bi mogao", "ako ti nije teško", "poštovani" su čisti trošak.
- ❌ Skupo: "Zdravo Gemini, molim te da li bi mogao da mi analiziraš ovaj tekst ispod i kažeš šta misliš?"
- ✅ Jeftino: "Analiziraj tekst. Izdvoj ključne tačke."
Ušteda: Na svakom upitu uštediš 5-10 tokena. Na 100 upita, to je 1000 tokena manje.
2. "Hibridna metoda" (Engleski upit, Srpski odgovor)
Ovo je trik koji profesionalci koriste. Iako želiš tekst na srpskom, uputstva (instrukcije) piši na engleskom. Engleski je "kompresovaniji" jezik za AI.
- ❌ Sve na srpskom: "Napiši mi uvod za poglavlje o istoriji veštačke inteligencije, fokusiraj se na Tjuringa." (cca 25-30 tokena)
- ✅ Engleski upit: "Write intro about AI history, focus on Turing. Language: Serbian." (cca 10-15 tokena)
Model će razumeti savršeno, a ti si "potrošio" manje kockica da mu objasniš šta želiš.
3. Čišćenje konteksta (Zatvori kutiju)
Najveći "žderač" tokena je dugačak razgovor. Svaki put kad postaviš novo pitanje u istom četu (prozoru), model mora ponovo da "pročita" sve što ste do tada pričali (sve prethodne poruke se ponovo šalju kao input).
- Savet: Ako prelaziš na novu temu (npr. završio si sa "istorijom AI" i prelaziš na "neuronske mreže"), otvori novi chat.
- Nemoj vući prtljag iz prošlog razgovora ako ti ne treba.
4. Zabrani "brbljanje" (Restriktivni output)
Modeli vole da filozofiraju i prave dugačke uvode. ("Svakako, evo objašnjenja koje ste tražili..."). To su bačeni tokeni.
Dodaj ovo na kraj svakog upita:
"Be concise."(Budi sažet)"No preamble."(Bez uvoda)"Just code."(Samo kod, bez objašnjenja - ako tražiš Python/Django pomoć)
5. Primer optimizacije (pre i posle)
Zamisli da želiš rezime nekog teksta za svoju knjigu.
| Loš upit (troši mnogo) | Dobar upit (štedi) |
|---|---|
| "Zdravo, imam ovde jedan tekst o mašinskom učenju. Da li možeš molim te da ga pročitaš i napišeš mi kratak sažetak od oko tri rečenice na srpskom jeziku? Hvala." | "Summarize text below in Serbian. Max 3 sentences. No filler text." |
| ~45 tokena | ~15 tokena |
Dodatni savet
Umesto da kopirate ceo tekst u chat (što troši input tokene), ako koristiš model koji podržava fajlove (poput Gemenija ili Clauda):
- Snimite poglavlje kao .txt ili .pdf.
- Uploadujte fajl.
- Pitajte: "Proveri greške u fajlu."
Ovo je često efikasnije jer modeli drugačije procesiraju fajlove nego "sirovi" tekst u chatu.
#tokeni
Komentari
Nema komentara. Šta vi mislite o ovome?