

39
На правах рекламы
после внедрения на «Балтике» ре-
шения по оптимизации управления
цепочками поставок, позволяющего
обрабатывать по 90 тыс. прогнозов
в час, один человек стал справлять-
ся с объемом работ, который раньше
выполнялся 30 сотрудниками, при
этом точность прогнозирования воз-
росла на 18,6%.
Работа с большими данными вос-
требована в бизнесе для анализа
поведения клиентов, автоматизации
принятия решений в режиме реаль-
ного времени, оптимизации запасов,
оценки рисков, построения прогно-
зов рынка.
Прежде компаниям приходилось
иметь дело лишь с четко структури-
рованными данными своей финан-
совой отчетности и такими же све-
дениями о клиентах и поставщиках.
Теперь значительная часть представ-
лена в форматах, мало соответству-
ющих привычным форматам корпо-
ративных баз данных, – это страницы
в социальных сетях, видеозаписи,
веб-журналы, логи многочисленных
устройств,
геолокационные
дан-
ные. Но именно из них можно из-
влечь дополнительную информацию
для принятия решений: если анке-
та заемщика кажется идеальной,
но контент-анализ его поведения
в интернете установил, что он с веро-
ятностью 95% является неимущим, –
это повод пересмотреть риски.
Подобные технологии намного эф-
фективнее, чем может показаться
на первый взгляд. В марте были опу-
бликованы результаты работы алго-
ритма, характеризующего пользова-
телей Facebook по оставляемым ими
лайкам. Расовая принадлежность
была угадана в 95% случаев, пол –
в 93%, политические взгляды (де-
мократ или республиканец) – в 85%,
религиозные убеждения – в 82%, на-
личие отношений – в 67%. При этом
анализ ведется не по очевидным
лайкам-маркерам, а по большим
объемам менее информативных,
но более популярных лайков.
Data science требует видеть в дан-
ных отображение реальных процес-
сов и уметь вычленять закономерно-
сти.
Рентабельные головоломки
Пока анализ больших массивов
данных стал неотъемлемой частью
операционной деятельности в не-
многих отраслях, таких как телеком-
муникации, интернет-реклама, соци-
альные сети, страхование.
По оценке IDC, в 2012 году объем
рынка систем хранения данных со-
ставил 8,6 млрд. долларов, при этом
за год в мире было сгенерировано
2,43 зеттабайта информации, что
в два раза больше, чем в 2010 году
(1,2 Зб). И перспективы у рынка за-
манчивые: «В корпоративной прак-
тике пока используется лишь 15–20
процентов доступных данных, пре-
жде всего те, что имеются в таблич-