Asi by bylo vhodné dodat, že přesnost strojového určení sentimentu je v praxi na úrovni 60% /Sentione tvrdí 65%/. U českého jazyka se nejde nyní dostat dále, protože stroj nepochopí nadsázku, ironii, a podobně. Tedy například "fakt super" vyhodnotí jako pozitivní zmínku... Tím pádem grafy sentimentu jsou při této odchylce naprosto nesmyslné. Slouží jako jezká uzkáýzka manipulace s čísly, daty a grafy, které ale ve výsledku jsou totálně mimo.
Zdravím,
Nepřesnost stanovení sentimentu je v komparativním srovnání značně omezená (její vliv). Uvedu příklad - vlnící se horký vzduch působí v létě optické poruchy a odečet výšky vzdáleného objektu je nepřesný. Poruchy ale nejsou nikdy tak velké, abyste si malou osobu spletli s velkou. Nepřesnost působí stejně na oba subjekty - komparaci můžete provést, přesné měření výšky však nikoliv.
Právě, že:
1. používáme specifické zmínky s vyfiltrovaným obsahem (pouze zmínky, které obsahují jednu stranu o délce max 3 věty).
2. sentiment zmínek kontrolujeme kontrolním vzorkem a úspěšnost takto upravených datasetů se blíží 72%
3. přesnost následně dodatečně zpřesňujeme - přetypováváme slova (například pitomio má v systému negativní konotace).
4. vliv přesnosti stanovení sentimentu je u všech subjektů stejný - komparace je mnohem přesnější. Na toto téma napíšeme další článek...