8 технологічних революцій України. Революція четверта: Big Data

Кілька років тому українські бізнеси майже в один голос заговорили про пророцтва. Роздріб, мобільні оператори і банки знайшли нове застосування величезних масивів даних, що лежать на серверах. Виявляється, з їх допомогою можна непогано оптимізувати витрати і утримати клієнтів. Liga.net і TECHIIA публікують нову серію історії про 8 технологічних революцій в Україні за час незалежності. Наш герой — big data. У чому її принадність, і де криється небезпека?


Big Data — це перш за все прикладна технологія. Збір та обробка даних — це невидимий, рутинний процес, що проходить практично непомітно. Люди захоплюються ідеальною роботою інтернет-рітейлу, дякуючи за зручну добірку товарів і круті акції. Однак, мало хто говорить «дякую» алгоритмам, які по крапельці збирають дані, завдяки масиву яких можливі нові механізми торгівлі. Big Data вже всюди і завжди. Все збирають дані, деякі навіть не розуміючи навіщо, але впевнені, що стане в нагоді
Юрій Лазебніков, керуючий партнер холдингу TECHIIA

Сотні і тисячі. Сотні і тисячі рекламних повідомлень атакували ваші очі з моменту, як ви сьогодні прокинулися, і до того, як зайшли до цього тексту. У Facebook вискочили курси англійської, в Instagram — креативні піжами, а YouTube підсунув «10 міфів про покупку автомобіля». У телефон впала SMS про акцію на манго від найближчого супермаркету. В пошту — знижка на пилососи від інтернет-магазину.

Причому — з великою ймовірністю — все це вам чи вже потрібно, або скоро знадобиться.

Ми давно звикли, що сервіси та додатки вгадують наші бажання наперед. Політики знають, чим би таким заманити в передвиборному меседжі. Ми навіть перестали замислюватися, як вони це роблять. А тим часом генеруємо таку кількість даних, що дивуватися і нічому. Просто бізнеси навчаються працювати з цією big data.

Що взагалі таке big data?

Прямий переклад терміна плюс-мінус вірний — великі дані. Тобто великі масиви структурованої і неструктурованої інформації. Наскільки великі? Тут в одній цифрі зійтися складно. Залежить від того, що за дані та з яких джерел. Але десятки і сотні нових гігабайт в день вже підходять.

У сучасному варіанті поняття big data разом включає методи та інструменти аналізу, обробки цих масивів. Часто хвостиком до нього чіпляються терміни data science і машинне навчання — їх методи використовуються для побудови моделей і виявлення неочевидних закономірностей в даних. А цілі можуть бути різними. Про це нижче.

Big data в Україні — порівняно молода область. Активно про неї заговорили в 2016 році паралельно з перемогою Дональда Трампа на виборах в США. Тоді глобальні ЗМІ активно обговорювали, що перемогу республіканцеві забезпечили «великі дані». І політтехнологи, які грамотно використовували ці дані для сверхтаргетованої реклами в соціальних мережах.

Виявилося, що і наші бізнеси цілком собі вміють витягати з даних комерційну користь.

Тут же почався шум, який періодично піднімається до сих пір. Мовляв, ці бізнеси продають наші персональні дані іншим бізнесам, щоб заробляти. Або самі на них наживаються. У відповідь на це компанії стабільно відповідають: ми не продаємо персональні дані. Зберігаємо все на захищених серверах, доступ строго регламентований. Якщо маємо справу зі зовнішніми кейсами, то дані максимально анонімізуючих. Із запуском GDPR в Європі все стало ще жорсткіше.

Через пару років бігдата-хайп почав сходити нанівець. Масовий ринок переключився на теми блокчейна і криптовалюта, про великі дані почали говорити менше. Проте пішов перехід в реальні кейси.

Юрій Лазебніков, керуючий партнер холдингу TECHIIA

«Big Data — це перш за все прикладна технологія. Збір та обробка даних — це невидимий, рутинний процес, що проходить практично непомітно. Люди захоплюються ідеальною роботою інтернет-рітейлу, дякуючи за зручну добірку товарів і круті акції. Однак, мало хто говорить «дякую» алгоритмам, які по крапельці збирають дані, завдяки масиву яких можливі нові механізми торгівлі. Big Data вже всюди і завжди. Все збирають дані, деякі навіть не розуміючи навіщо, але впевнені, що стане в нагоді».

Аналізувати масиви даних є сенс тим, у кого вони в принципі є хоч в якомусь адекватному вигляді. Бабуся, яка торгує пресою на зупинці, цього не зможе. Нехай навіть вона продає сотні газет в день, але без зібраних «слідів» покупців може покладатися хіба що на інтуїцію.

Ті ж, хто інформацію зберігає і структурує, в силах створити свою, цифрову інтуїцію. Самі зрозумілі сегменти — це мобільні оператори, банки, рітейл. Засилля клієнтських даних у них просто гріх не перетворювати в нові кейси. Потроху до чисто «людських» завдань додаються машинні — наприклад, на великих виробництвах.

Давайте розберемося, хто з них що вміє.

Мобільний оператор: поліпшити, показати, продати

Базам даних мобільних операторів позаздрить будь-хто. Вони зберігають інформацію про дзвінки, повідомлення, трафік, переміщення, рух грошей на рахунку і багато іншого.

Наприклад, в Київстарі розповідають, що щоденний потік даних, доступних для аналізу, становить понад 8 TB на добу. Це безцінна інформація не тільки про технічний стан мережі, а й поведінку клієнта. А розуміння поведінки монетизують дуже добре.

Оператори використовують аналіз великих даних, щоб утримувати існуючих клієнтів і збільшувати користування будь-якої послугою. У Vodafone кажуть, що раніше для цього ґрунтувалися на сотнях показників в розрізі одного номеру. Зараз — на десятках тисяч.

Також проекти, засновані на big data, допомагають оптимізувати операційну систему: будівництво та експлуатацію телеком-мережі, обслуговування клієнтів, запобігання шахрайству та інше.

Ілля Польшаков, директор з розвитку нових напрямків бізнесу в Київстар, вважає ключовим внутрішнім кейсом компанії CVM (customer value management) — управління життєвим циклом клієнта. Оператор аналізує, якими послугами користується абонент, скільки при цьому витрачає. Завдяки аналітиці, машинного навчання та обробці даних в реальному часі для клієнтів підбираються оптимальні тарифи та послуги.

В Київстар кажуть, що по CVM вдалося досягти ефекту в розмірі 2% від доходу оператора. Якщо врахувати, що виручка компанії в третьому кварталі склала 5,8 млрд грн, то мова може йти про більш 100 млн грн.

Vodafone найбільш масштабними кейсами вважає збільшення абонентської бази за рахунок зниження відтоку більш, ніж на 20% за понад 10 років. У кілька разів збільшилися доходи від допродажу послуг. А після впровадження 3G-4G спостерігали масштабне зростання проникнення дата-користувачів.

Володимир Рибалко, керівник напрямку Big Data Vodafone

«Ми з високою точністю знали, на яке повідомлення найкраще відреагує конкретний клієнт. Ефективність таких недорогих для компанії комунікацій в кілька разів перевершувала витратні ATL-комунікації (реклама в традиційних ЗМІ — Ред.)».

Кілька років тому з'явилася нова ідея. Слідом за зарубіжними колегами українські оператори вирішили монетизувати свої дані за допомогою зовнішніх компаній. Аякже — у найбільших — Київстар і Vodafone — на двох більше активних сім-карт, ніж жителів України. Такі бази добре екстраполюються на маркетингові задачі.

«Перші кейси із зовнішньої монетизації даних з'явилися в 2015-2016 році, коли для організацій-замовників були розроблені рішення для таргетированої розсилки SMS своїм клієнтам, яким підтвердили отримання рекламних повідомлень», — згадує Ілля Польшаков.

Як мобільний оператор обирає, кому слати рекламні повідомлення замовника?

Іноді, звичайно, здається, що шле як попало. Але все складніше. Замовник — ритейл, банк або інший бізнес — описує оператору профіль бажаного клієнта: живе/працює там-то, стать така-то, достаток такий-то. Оператор з якоюсь точністю обчислює таких клієнтів у своїй базі і робить на них розсилку. Є ще формат look alike. Замовник вибирає зі своєї бази «хороших» клієнтів, передає оператору їх номери телефонів без будь-якої персональної інформації. Алгоритми вишукують в них спільні ознаки, а потім пропозиція розсилається іншим абонентам оператора, які мають схожий портрет.

Екс-B2B-директор Київстар на початку минулого року розповідав Liga.Tech, що 70-80% попадання вже вважається хорошим результатом. Тому, якщо вам прилетіло щось непотрібне, можливо, ви потрапили саме в 20-30%.

Так, тут не йдеться про спам-розсилки служб таксі і SMS від шахраїв «ви виграли квартиру» або «вам заблокували карту». Там своя історія.

Пізніше оператори заговорили про проекти для фінансового сектору. Там навчилися вираховувати свій скоринговий бал. Ця абстрактна цифра формується на аналізі сотень і тисяч параметрів поведінки абоненту. Її відправляють банку-замовнику. А той у сукупності з іншими оцінками приймає рішення, чи видавати людині кредит. Так можна знизити ризик шахрайства.

Ще один інструмент мобільних операторів — так звані «теплові карти» (heat maps). Адже в базі зберігаються і дані про переміщення конкретних сім-карт. Якщо вибірка досить велика, оператор може показати їх маршрути, не розкриваючи особистих даних абонентів.

Банкам і рітейлерам цікаво дізнатися, де живе і як переміщається їх потенційний клієнт, щоб правильно розташувати відділення, магазини, банкомати. Міській владі і комунальним підприємствам це допомагає оптимізувати нинішні маршрути міського транспорту, запускати нові, розуміти, де будувати об'єкти інфраструктури. Або навіть завантажити аеропорти.

Здавалося б, SMS, скоринг — ну що такого? Але в тому ж Київстарі їх вважають якірними зовнішніми кейсами.

«Ці проекти найбільш затребувані серед бізнес-клієнтів і приносять Київстару щорічно суму, яка становить 1% від річного доходу компанії,» — говорить Ілля Польшаков. А це, на хвилиночку, 190 млн грн.

Далі — більше.

Vodafone планує підкорювати нові ринки: страхових, букмекерських послуг, медійної реклами. А в Київстарі переходять від індивідуальних проектів для великих клієнтів до інтегрованих рішень, де в одній системі ув'яжуться датчики інтернету речей, інструменти аналізу даних і автоматизації процесів. І до big data сервісу, яким малий і середній бізнес може користуватися «в режимі самообслуговування».

І тут, і в Київстар майбутнє бачать за відкритими API - коли компанії почнуть обмінюватися анонімізованою інформацією, консолідувати її і за рахунок цього знижувати операційні ризики і підвищувати ефективність бізнесів.

Банк: залучити, відсіяти, вгадати

Звичайною справою для банків стала спроба передбачити відтік або дефолт клієнта, як це давно роблять ОщадБанк, Альфа-Банк, Укрсиббанк, Monobank. Кредитна і платіжна історія, анкета і зовнішні дані (на зразок згаданих вище балів оператора) дають можливість зрозуміти, чи поверне людина кредит, за яким прийшла. Або помітити, що клієнт ось-ось втече до конкуренту.

Маркетингові завдання тут теж популярні. Наприклад, повідомити про нові умови депозиту. Або бонуси за активний перехід на безнал.

Як банки просувають безготівкові платежі?

Щоб клієнти активніше переходили на оплати картами і девайсами, банки навіть готові їх заохочувати. Але відправляти мотивацію на весь клієнтський портфель — це великі витрати, тому що нагадувати потрібно не раз і не два. Тому будуються моделі прогнозу - хто краще зреагує на кампанію? В результаті клієнти поділяються на сегменти. А банк далі вибирає. Або слати пропозицію тільки тим, хто з більшою ймовірністю включиться в акцію. Або на інший сегмент, де ймовірність менше, але їх все ж потрібно привчити користуватися картою.

А взагалі банки, як і інші галузі, дуже прагнуть до персоналізованого підходу.

У ПриватБанку, наприклад, кажуть, що перше завдання в роботі з big data — налаштувати зв'язок із клієнтом для збору фідбеку і налаштування аналітики для створення нових продуктів. Big data в даному випадку — це інформація про платіжну активність клієнту.

Олег Серга, прес-секретар ПриватБанку

«На початку шляху ми проаналізували платіжну поведінку клієнтів, щоб виділити кілька основних груп по економічній поведінці і зорієнтувати інформацію і пропозиції».

Цей проект в банку почали три роки тому. А в цьому році запустили проект «впізнавання». Smart-камера в відділенні розпізнає клієнта, і йому пропонують послугу, за якою він, найімовірніше, прийшов.

Кінцева мета — точно знати, які послуги, в якому каналі потрібні клієнтові в даний момент, і запропонувати ту, яка йому буде, ймовірно, потрібна в наступний момент.

Супермаркет: продати, уявити, здивувати

Звичайно, з big data пробує працювати саме великий, добре оцифрований ритейл. Аналіз своїх і зовнішніх даних допомагає вигідно розташувати магазин, передбачити асортимент, вгадати потребу певного покупця.

Наприклад, в Сільпо з 2006 року діє програма «Власний рахунок». Постійні покупці заповнюють анкети — і це дає розуміння їх портретів. Як розповідають в компанії, зараз у «Власного рахунка» 13 млн учасників. Цей масив великих даних — ефективний дослідний і маркетинговий інструмент.

«Персоналізовані пропозиції програми “Власний рахунок”, які отримує кожен постійний гість Сільпо, також засновані на Big Data і історії покупок, щоб залучати, розвивати і утримувати гостей в мережі в залежності від маркетингових завдань», — пояснює Андрій Кузьменко, керівник департаменту взаємовідносин з гостями Fozzy Group.

Восени 2018 року програму доповнив додаток, в якому вже близько 800 тис. користувачів. Як кажуть в Сільпо, учасники програми «Власного Рахунку» за 2010-2018 роки заощаджили більше 3,962 млрд грн — і це позитивно вплинуло на продажі всієї мережі.

А при прогнозі продажів в нових супермаркетах компанія враховує дані бізнес-активності та структури аудиторії. В Сільпо розробили кілька різних асортиментних матриць — в залежності від цільової аудиторії та місця розташування. У кожному супермаркеті вони можуть коригуватися на основі великих даних, включаючи агрегированную статистику «Власного рахунка». Для цього аналізують чеки, профайли гостей, результати кожного конкретного магазину і багато інших параметрів.

Але не всі великі компанії вже перейшли до таких схем. Наприклад, в АТБ, де величезний потік людей, повідомили, що big data в бізнес-процесах не застосовують.

Звичайно, завжди є ризик використання даних за Оруеллом і отримання контролю над населенням країни. Але хочеться вірити, що аналіз величезної кількості інформації зробить суспільство більш вільним, захищеним і здоровим.
Юрій Лазебніков, керуючий партнер холдингу TECHIIA

Виробництво: запобігти і передбачити

Українські промислові компанії вже намагаються впроваджувати напрацювання big data в свої процеси. Поки не розповідають про це широко: хтось реалізує пілот, хтось просто притримує ноу-хау.

Що взагалі можна робити?

Наприклад, у виробництві металевих виробів є проблема з браком. Виявити його можна лише наприкінці циклу. До цього виріб проходить велику кількість етапів нагрівання та охолодження. А це все витрати електрики. Якщо ж на кожному етапі збирати показники виробу, то зрештою на історичних даних можна побудувати модель передбачення браку на більш ранньому етапі. З певним припущенням, звичайно, але все одно заощадити.

Кейс з іншого полюсу — птахоферма. Як нещодавно пояснювали Liga.Tech представники компанії Intelsoft, в курнику є різноманітні датчики: скільки курям зайшло води, вологість, освітлення, температура і т.д. У сукупності всі вони впливають на те, якого розміру виросте птах. Знаючи наперед результат, компанія-виробник курячого м'яса може краще спланувати експорт.

І непомітний для кожного з нас, але дуже важливий приклад — енергетика. Кожен постачальник електроенергії спантеличений тим, як зробити її рівно стільки, скільки знадобиться споживачеві. Від цього залежать і зрізання зайвих витрат на генерацію, і відсутність пікетів через перевантаження і потухлих районів вечорами.

З прогнозом споживання енергетикам допомагають айтішники. Хороші новини — як розповідав в інтерв'ю Liga.Tech віце-президент з інжинірингу Luxoft, точність прогнозу досягає 95%. І боротьба йде за соті частки відсотка. За рахунок цього все легше керувати генерацією і уникати пікових навантажень. Правда, він же говорив, що в Україні це поки в дуже зародковому стані.

Держава: перевірити, дати, узгодити

Держава поки що не надто розповідає про плани на big data. Може, не хоче нас лякати в стилі Оруелла. Хоча окремі елементи вже застосовує.

Наприклад, в цьому році Мінсоцполітики запустила пілот по виявленню шахраїв серед людей, які звертаються за соціальною допомогою. Стандартний скоринг, як у банків, добрався і до міністерських кабінетів. За підрахунками це може заощадити Україні мільярди.

Інший напрямок — оптимізація держпослуг. Мінцифри вже пробує, орієнтуючись на фідбек від громадян, вибирати пріоритетні послуги для оцифровки. Можливо, це поставлять на потік: щоб аналізувати кількість і типи звернень за держпослугами, адаптувати послуги.

Олег Серга, прес-секретар ПриватБанку

«Мені здається, що дуже цікавий етап буде з початку наступного року, коли наші технології будуть інтегровані в проект “Держава в смартфоні”».

Третій напрям — охорона здоров'я. Реформа і догляд в онлайн можуть вивести предиктивну медицину на новий рівень. Але поки ми лише звикаємо до нових систем і накопичуємо шишки і дані про пацієнтів.

Юрій Лазебніков, керуючий партнер холдингу TECHIIA

«Дуже хотілося б, щоб в Україні Big Data знайшла застосування в медицині та інших соціальних сферах. Величезна кількість переносної електроніки збирає кожну секунду гігабайти інформації про фізичну активність, здоров'я і сон. У багатьох країнах це вже використовується для попередження захворювань і збільшення терміну життя».


На десерт — політика: прийти, налаштувати, перемогти

У темі big data несправедливо буде не згадати політичний випадок. Тим більше, у нас було щось подібне до «свого Трампа».

Ще навесні кейс описав Михайло Федоров, діджитал-стратег передвиборчої кампанії Володимира Зеленського, нинішній міністр цифровий трансформації. За його словами, команда кандидата зібрала кілька сотень тисяч анкет від волонтерів, які ділилися скаргами та пропозиціями у вільній формі. Потім обробили всі ключові слова, розділили людей на 32 сегменти: за соціальними ролями, соціальним статусом і потребами.

«Виходячи з цих сегментів, ми розуміли, кому ми найбільше цікаві, хто найбільше хоче з нами взаємодіяти. Ми виділили з них 7 ключових: айтішників, мам, людей, які підтримують певні пункти програми, і т.д. І працювали з цими сегментами», — розповів Михайло Федоров.

А далі діджитальщікі добре погралися із таргентингом на Facebook. «Ми розклали всю [передвиборчу] програму від 30 до 70 тез. І цими тезами таргетували на різні сегменти», — пояснював Михайло.

Дійсно: якщо порівняти кількість передвиборних рекламних оголошень в Facebook у Петра Порошенка і Володимира Зеленського, вона відрізняється в десятки разів. Порошенко бив по широким аудиторіям одним повідомленням. Зеленський — безліччю меседжів по маленьким аудиторіям.

Замість загалом

Чи є небезпека в тому, що наші дані будуть використовувати нам же на шкоду? Про це багато говорили після виборів Трампа і Brexit. Про те, як Google, YouTube, Facebook позбавляють нас людності за рахунок постійного аналізу нашої активності, кажуть самі екс-співробітники цих компаній. Дані стали новим небезпечним золотом — недарма Європа міцно взялася за GDPR.

Тут справедливо нагадати, що в епоху економіки уваги варто розвивати критичне мислення. Тоді big data буде корисною частиною повсякденності, а маніпуляції з нею користувачі сервісів мінімізують самі. Хоча, звичайно, це вічна битва між благом і шкодою. І межа її проходить в кожній окремій людині.

Юрій Лазебніков, керуючий партнер холдингу TECHIIA

«Звичайно, завжди є ризик використання даних за Оруеллом і отримання контролю над населенням країни. Але хочеться вірити, що аналіз величезної кількості інформації зробить суспільство більш вільним, захищеним і здоровим. Автопілот, профілактична медицина, комфортний шопінг, поліпшення екології і гнучка взаємодія інфраструктури міста з його мешканцями — вже поруч і дуже плавно і непомітно входять у наше життя. Без хайпа, революцій і проривів. Просто завтра жити без всього цього буде дуже некомфортно. І за все це ми будемо дякувати успішним стартапам і крутим корпораціям».


Оригінал статті за посиланням project.liga.net.

Підписатися на новини
Останні новини
Подію, спродюсовану WePlay Studios, фанати з усього світу обрали як найкращу в категорії «ШІ, метавсесвіт та віртуальні події — Розваги, спорт та музика»
02.05.2024
Продакшн-компанія WePlay Studio і лауреат премії «Ґреммі» продюсер Лоуренс «Ренс» Допсон об’єднуються задля створення більше контенту на культурну тематику.
05.03.2024
Звіт із корпоративної соціальної відповідальності за 2020-2023 роки
01.02.2024