Market Vectors / Financial One

ЦБ разработал опережающий индикатор на основе Big Data

ЦБ разработал опережающий индикатор на основе Big Data
2203

Банк России публикует первое исследование, посвященное анализу на основе «Больших данных» (Big Data). 

В докладе «Оценка экономической активности на основе текстового анализа» представлена методика расчета опережающего индикатора экономической активности в России, который построен на базе ежедневного контекстного анализа новостных сайтов с применением машинного обучения.

дбгшн.png

Согласно модели LDA, было выявлено 50 тем, обеспечивающих наилучшее статистическое разложение корпуса. Модель LDA не присваивает темам имена, однако увидев наиболее часто встречающиеся слова в каждой теме, мы можем понять, о чем данная тема, и присвоить ей адекватное название. Например, с января 2014 года по январь 2017 года основными темами в новостных статьях были темы, связанные с валютным курсом, нефтью, банковским сектором, ситуацией в США и так далее.

В работе используются два типа данных: неструктурированные и структурированные. В качестве неструктурированных данных, то есть данных, которые не имеют определенной структуры, выступают ежедневные новостные статьи, взятые из интернет-ресурса. Второй тип данных – это ежемесячный статистический показатель – композитный индекс деловой активности PMI (Purchasing Managers Index). Индекс деловой активности PMI используется в качестве прокси ВВП (в связи с недостаточно длинными временными рядами новостных статей). 

Новостные статьи были собраны с информационного ресурса, посвященного экономической тематике. Его выбор обусловлен широким охватом экономических новостей, отсутствием нерелевантных тем и простотой веб-скрапинга. Общее количество статей составило около 50 000, совокупный объем слов – 20–25 млн, что является приемлемым для проведения анализа. Данные по композитному индексу деловой активности PMI были взяты с сайта агентства Bloomberg.

В последние годы мировая информационная среда претерпевает стремительные изменения. Это сопровождается неуклонно растущими объемами информации и развитием новых методов ее обработки, которые открывают широкое пространство для анализа различных аспектов жизни людей, в том числе в области экономики.

Уже сегодня многие экономисты разрабатывают аналитические показатели, основанные на анализе Big Data. Сфера их применения весьма многообразна. Она включает в себя как прогнозирование экономики, так и ее анализ в реальном времени. Востребованность таких показателей обусловлена необходимостью получения максимально оперативной и полной информации для принятия решений в условиях быстро меняющейся ситуации в современной экономике. В связи с этим анализ на основе Big Data в настоящее время активно развивается в ряде зарубежных центральных банков.

«Построенный автором публикуемого  доклада новостной индикатор показал хорошие опережающие свойства, позволяя оперативно оценивать текущую ситуацию в экономике до публикации официальной статистики. Результаты работы послужат важной отправной точкой для дальнейшего развития аналитических показателей с использованием Big Data в Банке России», – говорится в релизе ЦБ.

Содержание доклада выражает личную позицию автора и может не совпадать с официальной позицией Банка России.

Подписывайтесь на Financial One в соцсетях:

Facebook || Вконтакте || Twitter || Youtube




Вернуться в список новостей

Комментарии (0)
Оставить комментарий
Отправить
Новые статьи
  • В российских акциях сохраняются нисходящие риски
    Елена Кожухова, аналитик ИК «ВЕЛЕС Капитал» 08.05.2026 16:25
    966

    Российский рынок завершает неделю падением индекса Мосбиржи примерно на 2% и снижением индекса РТС на 1,7%, при этом индикаторы обновили минимумы с ноября прошлого года (2590 пунктов) и апреля текущего года (1081 пункт) соответственно. Рынок оставался под нисходящим давлением жестких монетарных условий и отсутствия позитивных сдвигов по украинскому конфликту, к которым добавились более низкие цены на энергоносители.  Покупки наблюдались в отдельных бумагах в рамках краткосрочной восходящей коррекции, а также в ожидании объявления о годовых дивидендах, в частности, в акциях ВТБ.more

  • Аналитики Freedom Finance Global повысили прогнозную цену акций Eli Lilly and Company
    аналитики Freedom Finance Global 08.05.2026 15:57
    1001

    Квартальные результаты Eli Lilly (LLY) вновь превзошли даже самые оптимистичные ожидания. Выручка от Mounjaro продемонстрировала впечатляющую динамику, достигнув $8,6 млрд (+125% г/г) и существенно превысив консенсус-ожидания рынка примерно на $1,4 млрд. Стратегически важным событием квартала стало одобрение Foundayo, коммерческие продажи которого уже стартовали во II квартале.more

  • Цена нефти и газа. Попытка разворота наверх
    Андрей Мамонтов, эксперт по фондовому рынку «БКС Мир инвестиций» 08.05.2026 15:24
    1082

    Фьючерсы на нефть марки Brent завершили четверг, показав минус 1,19%. Нефть развернулась наверх: Иран обвинил США в нарушении перемирия и новой волне эскалации в Ормузском проливе. Учитываем, что с начала войны с Ираном новостные спекуляции возросли — общий сентимент каждый день меняется.more

  • Государственный долг США превысил ВВП впервые со времен Второй мировой войны
    Ксения Малышева 08.05.2026 14:30
    1141

    Государственный долг США впервые со времен Второй мировой войны оказался выше объема всей экономики страны. Согласно оценкам, приведенным в эфире CBS News, к концу апреля государственный долг Соединенных Штатов достиг $31,27 трлн и превысил показатель валового внутреннего продукта.more

  • Индекс Мосбиржи снова пытается опуститься ниже 2600 пунктов
    Владимир Чернов, аналитик Freedom Finance Global 08.05.2026 13:56
    1157

    Индекс Мосбиржи днем снижается на 0,35%, до 2606 пунктов, РТС падает на 0,35%, до 1100 пунктов, а индекс голубых фишек теряет 0,28%. Зона 2600 пунктов пока держится, но рынок снова идет к ней в отсутствии сильного покупателя и драйверов роста. Перед длинными выходными инвесторы явно не хотят набирать риск, особенно на фоне дешевеющей нефти и свежих геополитических новостей.more