Potencjał ukryty w tekście


11 grudnia 2015

Piotr Surma

Potencjał ukryty w tekście

Analitycy prognozują, iż globalna ilość danych podwaja się co dwa lata i w roku 2020 osiągnie 40 zettabajtów, czyli 40 miliardów terabajtów. Większość będą stanowić dane nieustrukturyzowane, między innymi dane tekstowe zawierające niezwykle cenne, z biznesowego punktu widzenia, informacje na temat konsumentów, ich preferencji i zainteresowań, czy też opinii o produktach i usługach. Choć tzw. Big Data w języku angielskim analizowane jest od wielu lat, język polski nie poddawał się dotychczas zaawansowanej analizie treściowej ze względu na swoje specyficzne cechy, między innymi odmianę części mowy czy swobodny szyk zdania. Poza stosunkowo prostymi narzędziami do analizy tzw. sentymentu, oraz niedoskonałymi adaptacjami narzędzi pierwotnie dostosowanych do analizy innych języków, niedostępne były rozwiązania dedykowane do analizy języka polskiego.

Obecnie, dzięki współpracy IBM z polską firmą Applica, na rynek trafia zaawansowane rozwiązanie do semantycznej analizy tekstu oparte o IBM SPSS Modeler. Dzięki wykorzystaniu wyników prac badawczo-rozwojowych prowadzonych przez firmę Applica, jak również wyników badań Instytutu Podstaw Informatyki Polskiej Akademii Nauk, rozwiązanie umożliwia szybką analizę dużych zbiorów danych tekstowych w języku polskim pod względem znaczeniowym. W pełni wspiera ono polską gramatykę, jest także wyposażone w rozbudowane słowniki języka polskiego.

Proponowane przez IBM i Applica rozwiązanie adresowane jest do wszystkich firm i instytucji, które dysponują dużymi zbiorami danych tekstowych wymagającymi analizy, między innymi banków, operatorów telekomunikacyjnych, ubezpieczycieli czy firm badawczych. Niezależnie czy jest to korespondencja e-mail z klientami, wypowiedzi w mediach społecznościowych czy też odpowiedzi respondentów na otwarte pytania ankietowe, rozwiązanie umożliwia zaawansowaną analizę tekstu. Co więcej, wyniki analizy treści tekstowych mogą być wykorzystywane nie tylko w celu poprawy jakości obsługi klienta bądź udoskonalania produktów i usług, lecz również w celu automatyzacji procesów obsługowych czy też w celu wykrywania nadużyć.

Zainteresował Cię nasz blog i chcesz wiedzieć więcej?

Zapisz się na nasz newsletter

Na Twój e-mail wyślemy ciekawe informacje związane z blogiem i IBM