Large Language Model (LLM) - mocná technologie
Využití technologie Large Language Model pro analýzu vlastních dat.
Obecné povědomí o technologii Large Language Model (LLM, česky Velký jazykový model) a jejích schopnostech přišlo s příchodem chatbota ChatGPT. ChatGPT a jeho schopnost generovat odpověď je však omezen pouze na data, na kterých byl jeho LLM model trénován. Nedokáže tak podávat odpovědi na základě interních a vlastních dat uživatele (s výjimkou v promptu předložených dat). Toto omezení je ilustrováno na dotazu týkajícího se osoby Petra Máchala z populární české pohádky S čerty nejsou žerty. Místo pekelné knihy hříchů, by se mohl Lucifer zeptat ChatGPT:
Za předpokladu, že jsme schopni vhodně nasadit a využít LLM modely pro analýzu vlastních nestrukturovaných dat, můžeme dosáhnout výstupu ilustrovaného níže.
Je důležité podotknout, že dosažení obdobného výsledku předpokládá znalost práce s nestrukturovanými daty. Data musí být zpracována a pomocí LLM převedena na vektory, které jsou uloženy do vektorové databáze (příp. indexů). Ve fázi generování odpovědi je pak opět využit LLM model. Tato ukázka využívá LLM model OpenAI GPT-4. V ukázce je zobrazena i možnost detekce entit pomocí LLM modelu.