В исследовании аналитики собрали записи из Твиттера, в которых упоминались биткоин и эфир. То же самое было сделано с использованием инструмента Google Trends. Основываясь на идеях предыдущих исследований, гипотеза заключалась в том, что количество записей в Твиттере и их посыл (положительный и отрицательный) могут влиять на цены криптовалют. В ходе исследования было обнаружено, что количество записей в Твиттере и поисковых запросов в Google – одни из первых показателей, которые меняются перед скачками цен.
Роль настроений участников рынка в техническом или рыночном анализе заключается в раскрытии отношения людей ко всему рынку или индивидуальному индексу (в данном случае BTC и ETH). Теория анализа настроений - это раздел технического анализа, в котором говорится, что ценовые тренды в конечном итоге являются отражением психологии толпы.
Следовательно, теоретически, если можно оценить, насколько позитивно или негативно люди относятся к конкретной акции или криптовалюте, можно оценить ее ценовую траекторию. Хотя в этом конкретном исследовании объем записей в Твиттере, а не настроения участников рынка, был признан ведущим фактором влияния на цену криптовалют. Отсутствие ярко выраженных настроений, являющихся ведущим фактором, теоретизировалось из-за большого количества «шума» в Твиттере относительно криптовалют по сравнению с реальными разговорами о них.
Например, исследователи обнаружили, что в Твиттере есть 21 миллион ботов, которые публикуют в основном фактическую информацию о ценах, рекламе, спаме и т.д. Обычные пользователи практически не ведут реальных дискуссий о том, как они относятся к BTC или ETH. Другая проблема, которую исследователи обнаружили в Твиттере, заключалась в том, что настроения носили в основном положительный характер, даже когда цены BTC и ETH падали.
Люди, которые пишут в Твиттере о криптовалютах, даже когда цены падают, интересуются ими не только в плане инвестирования, что смещает записи в сторону позитива. Несмотря на свои выводы, исследователи не исключили полностью анализ настроений с использованием различных методов моделирования.
Методология и результаты
В исследовании аналитики использовали открытый исходный код VADER (Valence Aware Dictionary и Sentiment Reasoner) для анализа данных записей в Твиттере. Данные по Твиттеру были взяты начиная с 2014 года с помощью сайта bitinfocharts.com. Данные SVI были взяты еще с 2004 года, и их масштабирование было пропорционально количеству поисков по всем темам для терминов bitcoin и ethereum.
Что касается данных Google trends, то в рамках исследования было выяснено, что цена тесно связана с поиском по ключевым словам bitcoin и ethereum, и что эти всплески поисковых запросов произошли до того, как наблюдался фактический рост цен. Была также обнаружена другая сильная корреляция между Твиттером и ценой BTC.
Наконец, с помощью машинного обучения результаты из Google Trends и данные записей в Твиттере также были помещены в линейную модель для проверки положительных корреляций. Данные были разделены между учебной моделью и тестированием на 80% и 20%.
Прошлым летом другая группа ученых проводила похожее исследование. Исследователи из Технологического института Стивенса в США под руководством профессора Фэн Май выяснили, что комментарии и посты в соцсетях могут влиять на цену биткоина.