← Fogalomtár
Fogalom
Chunking (darabolás)
A dokumentumok kisebb, feldolgozható egységekre bontása indexelés előtt. A darabolás módja erősen befolyásolja, hogy mit talál vissza később a rendszer.
Analógia
Mint egy hosszú szerződés indexelése: attól függően, hogy fejezetekre, bekezdésekre vagy mondatokra bontod, más pontossággal lehet majd visszakeresni.
Miért fontos?
RAG projektnél ez gyakran láthatatlan, mégis kritikus döntés. Ha túl nagyok vagy túl kicsik a darabok, a rendszer pontatlan, felszínes vagy félrevezető válaszokat fog adni.