Исследование Binance
Криптобиржа Binance
выпустила целое исследование, посвященное параллельному выполнению в блокчейне. Само решение появилось довольно давно, однако аналитики уже теоретически обобщили многолетние наработки. О технологии известно в первую очередь благодаря проекту Solana, однако решение в разном виде используют Vara, TON, Sui, Sei, Aptos, Linera, Fuel и Monad.
Проблема последовательного выполнения
Сдерживающим пропускную способность в блокчейне является проблема последовательного выполнения. В решении с последовательным выполнением каждая транзакция должна проверяться всей сетью, что приводит к значительному потреблению энергии и увеличению нагрузки на майнеров или валидаторов.
Параллельное выполнение призвано развести задачи и обрабатывать за раз большее количество транзакций, что должно благотворно сказываться на пропускной способности и обеспечивать лучшее масштабирование сети.
Специалисты из Binance обращают внимание, что эволюция вычислительных машин движется в сторону многозадачности и многопоточности. Доказательством может служить тот факт, что частоты процессоров за последние 20 лет не сильно ушли вперед – вместо этого увеличилось количество ядер. Это более эффективное решение, так как с подавляющим большинством задач несколько более слабых ядер справятся быстрее одного мощного.
Программирование следует этому тренду – современные решения пишутся таким образом, чтобы максимизировать положительный эффект от многопоточности. Поэтому в моде решения, где множество задач решается параллельно.
Как работает параллельное выполнение в блокчейне
Говоря максимально просто, параллельное выполнение позволяет обрабатывать множество транзакций одновременно. В условиях больших вычислительных мощностей и их многозадачности параллельное решение кажется наиболее эффективным.
Но есть ряд проблем, из-за которых последовательные блокчейн-решения являются более надежными и безопасными. Главная – зависимые транзакции. Что если параллельно будут обработаны две транзакции, в которых, например, один и тот же адрес отправляет криптовалюты на два разных адреса. Если выполнение этих транзакций будет полностью параллельно, то владелец кошелька сможет дважды потратить свои монеты. А такое не приветствуется.
Поэтому зависимые транзакции можно выполнять только последовательно. Зависимость транзакций – ключевой концепт, который означает, что:
-
Выходные данные одной задачи записываются на входные данные другой — например. Алиса переводит ETH Бобу (выход), а Вася (вход) передает ETH Кэрол.
-
Выходные данные нескольких задач записываются в одну и ту же ячейку памяти – например, и Алиса и Кэрол передают ETH Васе (выход).
Из этого очевидно, что распараллелить можно только независимые друг от друга задачи. Это, в свою очередь означает, что скорость блокчейна с параллельным выполнением всегда будет ограничена по самой длинной цепочке зависимых задач. И там не менее, независимых задач довольно много, поэтому для параллельных решений в блокчейне места предостаточно.
Различные способы параллельного выполнения
-
Шардинг. Эксперты Binance отнесли к параллельному выполнению шардинг. Это справедливо на макроуровне (шарды действительно обрабатывают свои транзакции параллельно друг другу), однако на микроуровне каждая из шард внутри себя обрабатывает транзакции последовательно.
-
Параллелизм задач. Это когда одновременно обрабатываются несколько транзакций. Например, если в распоряжении ноды имеется 16 ядер, она может одновременно обрабатывать по 16 транзакций.
-
Параллелизм данных – одна инструкция для множества данных (Single instruction multiple data, или SIMD). SIMD – низкоуровневое решение, позволяющее эффективнее работать с данными. Оно полезно для хеширования и верификации.
Недостатки параллельного выполнения
На фоне простых последовательных решений параллельные конструкции далеко не всегда смотрятся выигрышно. Скорее напротив, они значительно менее безопасны, предсказуемы и просты.
Авторы исследования суммировали уязвимые места параллельного выполнения и выявили ряд критических:
-
ситуация гонки (неопределенность результата, возникающая при неправильном определении независимых транзакций);
-
проблемы с повторным входом;
-
взаимоблокировки, когда две или более задачи бесконечно ожидают выполнения друг друга. Каждая из них не может выполниться до тех пор, пока не выполнится другая;
-
некомпонуемость, когда программный код сам по себе может быть правильным, но выдавать критические ошибки при использовании в разных условиях.
Также условно критическими (то есть критическими в определенных ситуациях) видятся еще две проблемы:
-
инверсия приоритетов или состояние, при котором задача с низким приоритетом может косвенно блокировать задачу с более высоким приоритетом из-за неправильной работы планировщика;
-
нехватка ресурсов, когда некоторые задачи потребляют больше ресурсов, чем им положено, лишая другие задачи необходимых им ресурсов.
Вывод
Погоня за пропускной способностью может обойтись довольно дорого. Параллельное выполнение – сложная конструкция, которая привносит много проблем, обеспечивая, однако, существенную прибавку к производительности.