/
Blog · BaseTech
Toate articolele
Insights despre ERP, AI/RAG, agenți autonomi, pSEO, SaaS și data pipelines — scrise pentru companii care construiesc.
Insights despre ERP, AI/RAG, agenți autonomi, pSEO, SaaS și data pipelines — scrise pentru companii care construiesc.
RAG conectează modelul la baza ta de cunoștințe ca să răspundă clienților pe surse reale, cu citare. Unde pui sistemul, ce alegi și ce eviți.

Echipa de customer support primește aceleași 50 de întrebări în fiecare săptămână. Răspunsurile există deja — în help center, în tichete vechi, în documentația de produs. Problema nu e că lipsește informația. E că un agent o caută manual, în cinci locuri diferite, de fiecare dată.
RAG (Retrieval-Augmented Generation) schimbă fix asta. În loc să generezi un răspuns din ce „știe” un model în general, conectezi modelul la baza ta de cunoștințe și îl pui să răspundă pe surse reale, cu citare. Clientul primește un răspuns corect, în secunde, fără să aștepte un agent liber.
Articolul arată unde pui RAG într-un flux de support, ce alegi pentru fiecare strat și ce capcane te costă bani dacă le ignori. Dacă pleci de la zero cu conceptul, citește întâi ce este RAG și cum funcționează.
Patru lucruri concrete, măsurabile:
Diferența față de un chatbot „cu reguli” clasic: ăla răspunde doar la ce ai scris explicit în arbore. RAG răspunde la formulări pe care nu le-ai anticipat, pentru că înțelege semantic întrebarea și caută în tot ce ai indexat.
Asta e decizia care contează cel mai mult, și mulți o sar. RAG într-un support are două forme, cu profil de risc complet diferit.
1. Copilot pentru agent (agent-assist). Sistemul propune răspunsul, agentul îl verifică și îl trimite. Omul rămâne în buclă. Riscul de răspuns greșit e mic — există un filtru uman înainte să ajungă la client. Adoptarea e rapidă, pentru că nu sperii pe nimeni.
2. Chatbot pentru client (customer-facing). Sistemul răspunde direct clientului, fără om la mijloc. Aici câștigi deflection real, dar și riscul e maxim: o halucinație ajunge direct la client. Un răspuns greșit despre politica de retur sau despre un pas tehnic te costă încredere, uneori bani.
Recomandarea pragmatică: pornește cu agent-assist. Strângi date despre ce întreabă lumea și cât de bune sunt răspunsurile, cu un om care prinde greșelile. După ce evaluarea arată acuratețe constantă, deschizi treptat partea customer-facing — întâi pe categoriile sigure (FAQ, status comandă), nu pe tot.

Vezi și alte cazuri enterprise de RAG dincolo de support — helpdesk intern, analiză de contracte, enablement de vânzări.
Fluxul e același indiferent de stack:
Pasul 6 e cel care separă un sistem serios de o jucărie. Instrucțiunea către model nu e „răspunde”, ci „răspunde din context, iar dacă nu e acolo, spune că nu știi”:
Dacă vrei un exemplu concret de implementare cap la cap, cu cod, vezi cum construiești un sistem RAG cu Next.js.
Calitatea răspunsurilor e plafonată de calitatea surselor. „Garbage in, garbage out” e aici literal.

Două reguli de aur. Una: prospețime. O bază de cunoștințe veche e mai periculoasă decât niciuna — dă răspunsuri vechi cu încredere. Stabilește un mecanism de refresh când conținutul-sursă se schimbă. Doi: nu indexa ce nu vrei să citeze. Dacă un document e confidențial sau depășit, scoate-l din index — nu te baza pe model să-l evite.
Nu există un stack „corect”. Alegi pe baza a ce ai deja, a constrângerilor de date și a echipei. Iată opțiunile reale, fără agendă.
Baza vectorială
Pentru volume mici-medii de support, oricare merge. Decizia reală e managed vs self-host, nu numele de pe cutie.
Modelul de limbaj
Pentru o companie din România sau UE, rezidența datelor și GDPR cântăresc des mai mult decât ultimul procent de calitate. Dacă tichetele conțin date sensibile, un model self-hosted sau un furnizor cu procesare în UE poate fi cerința, nu opțiunea.
Orchestrare Framework-uri ca LangChain sau LlamaIndex grăbesc startul, dar pentru un flux de support relativ simplu, cod propriu e adesea mai ușor de întreținut decât o abstracție în plus. Alege framework dacă îți accelerează echipa, nu pentru că „așa se face”.
Înainte să-l lași pe clienți, fă-ți un set de evaluare: 50–100 de întrebări reale cu răspunsul corect cunoscut. Rulezi sistemul pe ele și măsori. Apoi, în producție, urmărești:
Fără măsurare, restul sunt presupuneri. Setul de evaluare e primul lucru de construit, nu ultimul.
Nu. Preia întrebările repetitive și pregătește răspunsuri pentru cele complexe. Agenții se ocupă de cazurile care chiar cer judecată umană. Scopul e să muți efortul, nu să tai oameni.
Un pilot de agent-assist pe o bază de cunoștințe existentă se poate ridica în câteva săptămâni. Partea customer-facing, cu evaluare serioasă și escaladare, cere mai mult — pentru că aici greșelile sunt vizibile.
Sistemul trebuie să spună „nu am informația” și să escaladeze, nu să inventeze. Lipsa de răspuns e un semnal util: arată ce articole îți lipsesc din KB.
Da, dar alegerea modelelor contează. Folosește embeddings și un model de generare care performează bine pe română și testează pe tichete reale, nu pe exemple în engleză.
Depinde de volum, de modelul ales și de unde rulezi. Costul principal vine din apelurile la model și din stocarea vectorilor — îl detaliem separat, pe componente.
Un sistem de support pe RAG nu e un chatbot pe care îl pornești și uiți de el. E o arhitectură: surse curate, retrieval bun, grounding strict, escaladare și evaluare continuă. Pusă cap la cap corect, scade timpul de răspuns și ține clienții mulțumiți fără să umfli echipa.
Dacă vrei să construiești unul pentru produsul tău — de la primul pilot agent-assist până la deflection real în producție — discută cu o echipă care a făcut asta. Sau explorează toate articolele despre AI și RAG.

Un sistem RAG rar costă cât crezi — și aproape niciodată din cauza LLM-ului. Împărțim factura pe componente, cu cifre concrete pe 2026.

Construiești un sistem RAG complet pe stack-ul tău: Next.js, Vercel AI SDK și MongoDB Atlas. Cod real, pas cu pas, de la ingestion la răspuns.

Compari RAG cu fine-tuning pe 8 criterii. Vezi 3 scenarii cu cost real și decision tree în 4 întrebări pentru a alege arhitectura corectă.
Articole noi despre ERP, AI, agenți și pSEO, direct pe email. Fără spam.