Market Vectors / Financial One

ЦБ разработал опережающий индикатор на основе Big Data

ЦБ разработал опережающий индикатор на основе Big Data
2230

Банк России публикует первое исследование, посвященное анализу на основе «Больших данных» (Big Data). 

В докладе «Оценка экономической активности на основе текстового анализа» представлена методика расчета опережающего индикатора экономической активности в России, который построен на базе ежедневного контекстного анализа новостных сайтов с применением машинного обучения.

дбгшн.png

Согласно модели LDA, было выявлено 50 тем, обеспечивающих наилучшее статистическое разложение корпуса. Модель LDA не присваивает темам имена, однако увидев наиболее часто встречающиеся слова в каждой теме, мы можем понять, о чем данная тема, и присвоить ей адекватное название. Например, с января 2014 года по январь 2017 года основными темами в новостных статьях были темы, связанные с валютным курсом, нефтью, банковским сектором, ситуацией в США и так далее.

В работе используются два типа данных: неструктурированные и структурированные. В качестве неструктурированных данных, то есть данных, которые не имеют определенной структуры, выступают ежедневные новостные статьи, взятые из интернет-ресурса. Второй тип данных – это ежемесячный статистический показатель – композитный индекс деловой активности PMI (Purchasing Managers Index). Индекс деловой активности PMI используется в качестве прокси ВВП (в связи с недостаточно длинными временными рядами новостных статей). 

Новостные статьи были собраны с информационного ресурса, посвященного экономической тематике. Его выбор обусловлен широким охватом экономических новостей, отсутствием нерелевантных тем и простотой веб-скрапинга. Общее количество статей составило около 50 000, совокупный объем слов – 20–25 млн, что является приемлемым для проведения анализа. Данные по композитному индексу деловой активности PMI были взяты с сайта агентства Bloomberg.

В последние годы мировая информационная среда претерпевает стремительные изменения. Это сопровождается неуклонно растущими объемами информации и развитием новых методов ее обработки, которые открывают широкое пространство для анализа различных аспектов жизни людей, в том числе в области экономики.

Уже сегодня многие экономисты разрабатывают аналитические показатели, основанные на анализе Big Data. Сфера их применения весьма многообразна. Она включает в себя как прогнозирование экономики, так и ее анализ в реальном времени. Востребованность таких показателей обусловлена необходимостью получения максимально оперативной и полной информации для принятия решений в условиях быстро меняющейся ситуации в современной экономике. В связи с этим анализ на основе Big Data в настоящее время активно развивается в ряде зарубежных центральных банков.

«Построенный автором публикуемого  доклада новостной индикатор показал хорошие опережающие свойства, позволяя оперативно оценивать текущую ситуацию в экономике до публикации официальной статистики. Результаты работы послужат важной отправной точкой для дальнейшего развития аналитических показателей с использованием Big Data в Банке России», – говорится в релизе ЦБ.

Содержание доклада выражает личную позицию автора и может не совпадать с официальной позицией Банка России.

Подписывайтесь на Financial One в соцсетях:

Facebook || Вконтакте || Twitter || Youtube




Вернуться в список новостей

Комментарии (0)
Оставить комментарий
Отправить
Новые статьи
  • На IPO выходит крупнейший участник российского кабельного рынка
    Наталья Мильчакова, ведущий аналитик Freedom Global 08.06.2026 20:10
    327

    ПАО «Инкаб Холдинг», крупнейший в России и СНГ производитель волоконно-оптического кабеля, объявил о планах выхода на IPO и листинга акций на Московской бирже уже до конца июня текущего года. Напомним, что ещё весной Банк России зарегистрировал дополнительную эмиссию акций «Инкаб Холдинга». more

  • Индекс Мосбиржи смотрит на минимум 2025 года, медвежьи настроения усиливаются
    Елена Кожухова, аналитик ИК «ВЕЛЕС Капитал» 08.06.2026 19:55
    321

    Российский рынок акций к окончанию основной сессии вышел в более глубокий минус, отыгрывая отсутствие бычьих драйверов и усиление санкционной риторики западных стран. Индекс Мосбиржи к 18:30 мск упал на 1,71%, до 2517,97 пункта, обновив очередной минимум с ноября 2025 года. Индекс РТС снизился на 1,45%, до 1082,04 пункта, получив сдержанную поддержку со стороны валютного рынка.more

  • Российский рынок пробивает годовой минимум
    Дмитрий Лозовой, аналитик ФГ «Финам» 08.06.2026 19:43
    369

    Российский рынок завершает день в крайне слабом состоянии: Индекс МосБиржи обновил очередной минимум с ноября 2025 года и в моменте опускался к 2517 пунктам, теряя более 1,9%. more

  • Индекс Мосбиржи может опуститься до 2500 пунктов
    Наталья Мильчакова, аналитик Freedom Global 08.06.2026 18:48
    354

    Торги 8 июня на российских фондовых площадках стартовали в небольшом плюсе с последующим разворотом вниз. К последнему часу основной сессии индекс Мосбиржи падал на 1,27%, а РТУ опускался на 1,35%.more

  • Поставки Газпромом трубопроводного газа в Европу и Китай достигли рекорда
    Наталья Мильчакова, аналитик Freedom Finance Global 08.06.2026 17:55
    389

    Газпром отчитался за 2025 год об увеличении поставок по второй нитке Турецкого потока в связи с прекращением транзита через Украину, не уточняя, о каких конкретно объемах идет речь. Ранее оператор европейских газопроводов ENTSOG оценил его в 18,3 млрд куб. м, что на 8% больше, чем в 2024-м. Газпром называет причиной увеличения экспорта в европейском направлении новые контракты и улучшение управления суточными объемами транспортировки.more