Analýza textu

Vytváříme učící se nástroje v oblasti zpracování přirozeného jazyka. Zabýváme se především oblastí zboží, služeb a také news.

Například při analýze recenzí používáme vlastní POS analyzátory a datasety se stop slovy. Dokumenty převádíme do vektorových tvarů pomocí tf-ifd a shlukovacích metod (k-means) rozdělujeme do shluků se stejnými tématy. Identifikujeme shluky s vysokou mírou vnitřní integrity.Identifikovaná témata se týkají hlavních parametrů zkoumaného segmentu produktů. Takto vytvořené shluky pro celý segment založené na odborných článcích používáme pro klasifikaci recenzí k jednotlivým produktům. Z identifikovaných shluků vybíráme ty s nejvyšší vypovídací hodnotou – nejblíže centroidu daného shluku – a prezentujeme je jako vhodného zástupce pro danou množinu recenzí.