Market Vectors / Financial One

ЦБ разработал опережающий индикатор на основе Big Data

ЦБ разработал опережающий индикатор на основе Big Data
2147

Банк России публикует первое исследование, посвященное анализу на основе «Больших данных» (Big Data). 

В докладе «Оценка экономической активности на основе текстового анализа» представлена методика расчета опережающего индикатора экономической активности в России, который построен на базе ежедневного контекстного анализа новостных сайтов с применением машинного обучения.

дбгшн.png

Согласно модели LDA, было выявлено 50 тем, обеспечивающих наилучшее статистическое разложение корпуса. Модель LDA не присваивает темам имена, однако увидев наиболее часто встречающиеся слова в каждой теме, мы можем понять, о чем данная тема, и присвоить ей адекватное название. Например, с января 2014 года по январь 2017 года основными темами в новостных статьях были темы, связанные с валютным курсом, нефтью, банковским сектором, ситуацией в США и так далее.

В работе используются два типа данных: неструктурированные и структурированные. В качестве неструктурированных данных, то есть данных, которые не имеют определенной структуры, выступают ежедневные новостные статьи, взятые из интернет-ресурса. Второй тип данных – это ежемесячный статистический показатель – композитный индекс деловой активности PMI (Purchasing Managers Index). Индекс деловой активности PMI используется в качестве прокси ВВП (в связи с недостаточно длинными временными рядами новостных статей). 

Новостные статьи были собраны с информационного ресурса, посвященного экономической тематике. Его выбор обусловлен широким охватом экономических новостей, отсутствием нерелевантных тем и простотой веб-скрапинга. Общее количество статей составило около 50 000, совокупный объем слов – 20–25 млн, что является приемлемым для проведения анализа. Данные по композитному индексу деловой активности PMI были взяты с сайта агентства Bloomberg.

В последние годы мировая информационная среда претерпевает стремительные изменения. Это сопровождается неуклонно растущими объемами информации и развитием новых методов ее обработки, которые открывают широкое пространство для анализа различных аспектов жизни людей, в том числе в области экономики.

Уже сегодня многие экономисты разрабатывают аналитические показатели, основанные на анализе Big Data. Сфера их применения весьма многообразна. Она включает в себя как прогнозирование экономики, так и ее анализ в реальном времени. Востребованность таких показателей обусловлена необходимостью получения максимально оперативной и полной информации для принятия решений в условиях быстро меняющейся ситуации в современной экономике. В связи с этим анализ на основе Big Data в настоящее время активно развивается в ряде зарубежных центральных банков.

«Построенный автором публикуемого  доклада новостной индикатор показал хорошие опережающие свойства, позволяя оперативно оценивать текущую ситуацию в экономике до публикации официальной статистики. Результаты работы послужат важной отправной точкой для дальнейшего развития аналитических показателей с использованием Big Data в Банке России», – говорится в релизе ЦБ.

Содержание доклада выражает личную позицию автора и может не совпадать с официальной позицией Банка России.

Подписывайтесь на Financial One в соцсетях:

Facebook || Вконтакте || Twitter || Youtube




Вернуться в список новостей

Комментарии (0)
Оставить комментарий
Отправить
Новые статьи
  • Рынок акций РФ перешел к коррекции
    Владимир Чернов, аналитик Freedom Finance Global 06.04.2026 10:47
    13

    На старте торгов в понедельник, 6 апреля, индекс Мосбиржи снижается на 0,49% до 2760 пунктов, тогда как РТС растет на 0,26% до 1080 пунктов. Расхождение объясняется валютным фактором. Рубль укрепился, поэтому долларовый индекс РТС показал рост, а рублевый индекс Мосбиржи оказался под давлением. Дополнительно на Мосбиржу давит фиксация прибыли после сильного роста нефтянки и перегретости отдельных бумаг.more

  • Приближение апрельского заседания постепенно будет подогревать интерес к вторичному рынку госбумаг.
    Дмитрий Грицкевич, Управляющий по анализу банковского и финансового рынков ПСБ 06.04.2026 10:15
    63

    Рынок ОФЗ третью неделю подряд завершил торги в нисходящем боковике, нивелировав около половины роста на мартовском заседании и достигнув 119 пунктов по индексу RGBI. На наш взгляд, поведение индекса пока полностью укладывается в сценарий, который наблюдался между заседаниями февраля и марта: затяжной боковик и переход на новый уровень накануне заседания.more

  • На неделе видим риски отступления юаня ниже 11,5 рублей
    Богдан Зварич, управляющий по анализу банковского и финансового рынков ПСБ 06.04.2026 09:50
    71

    На прошлой неделе рубль продолжил тенденцию к укреплению, несмотря на прохождение в понедельник пика налоговых выплат и снижение поддержки национальной валюты со стороны экспортеров. В результате пара юань/рубль к закрытию пятницы откатилась к отметке 11,5 рублей.more

  • С чем связан сегодняшний рост акций ВТБ?
    Наталья Мильчакова, аналитик Freedom Finance Global 03.04.2026 18:55
    1199

    Сегодня на фоне небольшого снижения российского фондового рынка акции банка ВТБ поднимаются на 1,5%, до 91,3 руб.more

  • По ценам на нефть возможны новые максимумы, поддержка российского рынка ограничена
    Елена Кожухова, аналитик ИК «ВЕЛЕС Капитал» 03.04.2026 18:35
    1420

    Российский рынок готов завершить неделю падением индекса Мосбиржи примерно на 1% и изменением индекса РТС менее чем на 0,5%: последний продолжал получать поддержку от более крепкого рубля. Индикатор Мосбиржи по ходу недели опускался до очередного минимума с февраля текущего года 2758 пунктов, а долларовый РТС удерживался выше самого низкого значения текущего года 1051 пункт. Рынку в целом все еще недоставало значимых масштабных драйверов, а влияние сырьевых площадок было противоречивым.more