در تاریخ ۱۵ می ساعت ۱: ۱۴ به وقت اقیانوس آرام، شبکه استلار (Stellar) به مدت ۶۷ دقیقه به خاطر عدم توانایی برای رسیدن به اجماع، متوقف شده بود. در این مدت هیچ لجری بسته نشد و هیچ تراکنشی انجام نگرفت و اساساً شبکه استلار از کار افتاده بود.

ارزجو: با این حال وضعیت لجر کاملا امن و استوار باقی ماند. استلار در حدود ۱۵۰ هزار کاربر در روز دارد و بیش از ۳ میلیون اکانت در اختیار دارد. هیچ کس پول خود را از دست نداد و بالانس ها به وسیله هیچ فورکی دچار مشکل نشدند. در ساعت ۲: ۲۱ دقیقه، لجرها شروع به بسته شدن کردند و در صبح روز بعد شبکه شروع به فعالیت کرد.

لزومی ندارد که بگوییم اتفاقی مانند این، اصلا خوشایند نیست و باعث شد که متوجه چند اصلاحیه که لازم به انجام هستند، شویم. این اصلاحیه ها شامل مواردی هستند که در زیر در موردشان توضیح می‌ دهیم.

۱) این توقف به خاطر ایجاد مشکل در پروتکل کانسنس استلار نبوده است. در واقع این پروتکل به خوبی به کار خود ادامه می داد. برای سیستمی مانند استلار یک توقف موقت بهتر از در هم ریختگی دائمی فورک می باشد. ولی اتفاق دیروز نشان داد که استلار باید به مرور زمان ابزار پیشرفته تر و بهتری را مورد استفاده قرار دهد. ما به سیستم های نظارتی بهتری برای ولیدیتورها (اعتبار سنج‌ ها) احتیاج داریم و پس از آنکه یک اعتبارسنج متوقف شد، باید بتوانیم آسان‌تر آن را دوباره راه اندازی کنیم.

۲) ما شاهد ادعاهای بودیم که می گفتند استلار بیش از اندازه متمرکز است و تا حدودی در زمینه نود های اس دی اف SDF دارای ضعف است، که باعث شده اند این شبکه به طور کلی از کار بیفتد. نکته جالب این است که در واقع، واقعیت خلاف این مسئله می ‌باشد. استلار به تازگی تعداد زیادی نود اضافه کرده است. و برخی از این نودها مقدار زیادی اجماع مسئولیت را بر عهده گرفتند. ما باید سعی کنیم استانداردهای زمان‌بندی مناسب تر، اعتبارسنج پیکربندی، ساخت کواروم در جامعه ارزهای دیجیتال به کار ببریم.

 

نقش پروتکل در توقف

استلار به عنوان یک طرح ساخت اساسی، گزینه ثبات و انعطاف‌پذیری بخش ‌های مختلف را بر جسارت ترجیح داده بود. به عبارت دیگر هنگامی که پروتکل کانسنسس استلار (SCP) با عدم قطعیت اجماع رو به رو شد، ترجیح داد به جای انجام عملیات در وضعیت تناقض بالقوه، متوقف شود. این شبکه از شبکه های بلاک چین دیگر متفاوت است. در بلاک چین های دیگر زنجیره باید به کار خود ادامه دهد، حتی به قیمت ایجاد فورک نرم (soft fork).

مؤسسات مالی توقف سیستم را به دیتای متناقض ترجیح می‌دهند، به همین علت است که استلار را انتخاب می ‌کنند. برای یک شبکه مالی بهتر است موقتاً از کار بیفتد تا اینکه اشتباهات یا نتایج اشتباه ارائه دهد.

البته با ابزار مناسب، این شبکه متوقف نمی‌شد. با مواردی که در زیر گفته می‌شود می‌توانیم از ریسک‌ های بعدی جلوگیری کنیم:

– نظارت و هشدار بهتر. افرادی که با اعتبار سنج‌ ها کار می ‌کنند، باید آگاه باشند که در چه هنگامی نودها دیگر موجود نیستند. ما می توانیم کارهای مختلفی برای برطرف شدن این مشکل انجام دهیم و در حال ایجاد تغییرات در هسته استلار هستیم که در هنگام از دست رفتن نودها، سریع تر متوجه مساله شویم و اپراتور ها بتوانند هشدارهایی را هنگامی که یک نود مهم از کار افتاده است، دریافت کنند. همچنین در حال کار کردن بر روی استلار بیت (Stellarbeat) هستیم تا بتوانیم در هنگام از کار افتادن نودهای مهم در شبکه، مشکل را زودتر تشخیص دهیم. همچنین در حال ساخت یک ربات هستیم تا هنگامی که نود ها از کار می افتند پستی به کانال اعتبار سنج‌ های ما ارسال نماید. همه این کارها باعث می شود احتمال ایجاد دوباره وضعیت شکننده ای که دیروز شبکه دچار آن شده بود، کمتر شود.

– ری استارت ‌های سریع‌ تر. تمرکز مهم دیگر بر روی این مساله است که به اپراتور ها کمک کنیم زودتر بتوانند شبکه را دوباره راه اندازی کنند. در حال حاضر این فرآیند به وسیله استلار کور (Stellar-core) انجام می شود که نرم‌افزاری سنگین است و احتیاج به هماهنگی زیادی با شرکت کنندگان دارد. چندین راه وجود دارد تا اعتبار سنج ‌ها بتوانند به سهولت و سرعت از وضعیت توقف خارج شوند و در حال حاضر بر روی پیاده سازی این امکان در استلار کور کار می ‌کنیم. این توقف در صورتی که اقدامات ذکر شده انجام شده بودند، کوتاه مدت تر می‌بود.

حتی قبل از این توقف بر روی بهبود توانایی های استلار کور کار می کردیم. استلار کور (Stellar-core 11.1.0RC) در حال حاضر فرمانی برای ارسال گزارش ‌های پیوسته دارد. بقیه فرمان ‌های نظارت نیز در حال تنظیم هستند.

 

افزایش عدم تمرکز در استلار

در ماه‌های گذشته جامعه استلار، در حال کار بر روی راه اندازی اعتبار سنج‌ های جدید و ساخت نرم افزارهای متنوع بوده است تا استلار بتواند بدون دخالت مستقیم موسسه توسعه استلار (SDF) به کار خود ادامه دهد. شما می توانید در مورد این تلاش ها، در پست جدید ساتوشی ‌پی (SatoshiPay) بخوانید.

بسیاری از این نود های جدید بر طبق استانداردهایی فعالیت می ‌کنند که شبکه از آنها انتظار دارد. در چند هفته گذشته ما به کرات شاهد مشکل ایجاد کردن اعتبار سنج‌ های از کار افتاده و خراب بودیم. بودیم. این مسئله باعث شده بود که آن وضعیت ناهنجار ایجاد شود. یک یا دو اشتباه بیشتر هم در زمان نامناسب می تواند به کل، شبکه را متوقف کند. و این همان چیزی است که دیروز اتفاق افتاد: کی ‌بیس (Keybase) اعتبارسنج خود را هنگامی که دیگر اعتبار سنج‌ ها متزلزل یا از کار افتاده بودند، از کار انداخت و استلار نیز متوقف شد.

 

با این روش ها می توانیم از این مسئله جلوگیری کنیم:

– بهتر است از اعتبار سنج‌ های جدید کمک بگیریم. کاربران به استانداردهای تثبیت شده و مرورگرهایی احتیاج دارند تا از آنها استفاده کنند. باید ابزار هایی در اختیار آنها قرار داده شود تا دچار مشکل نشوند. توجیه علت این تقاطع‌ها، کار ساده ای نیست و باید دستورالعمل های عمومی بیشتری در این زمینه وجود داشته باشد.

– استاندارد های بهتر اپراتور. ما می توانیم از هماهنگی بیشتر اپراتورها سود ببریم تا جدول بندی دقیق تری برای ارتباط عمومی داشته باشیم. همچنین باید به اپراتورها کمک کنیم تا نودها و کواروم‌ های خود را سالم و به روز نگه دارند.

 

وضعیت شبکه

در واکنش به توقف دیروز شبکه، اعتبار سنج‌ های اصلی بر روی شبکه باعث ایجاد تغییر عملکردهایی شد که کواروم ‌ها ناچار شدند فقط اعتبار سنج‌ های سالم را در بر بگیرند. در عرض یک ساعت شبکه هنوز هم در حال فعالیت بود و تراکنش ها را انجام می ‌داد و لجرها را می بست.

روی هم رفته توقف شبکه دیروز یک آزمون استرس بود که استلار از آن در زمینه امنیت کاربران سربلند بیرون آمد، ولی در زمینه هماهنگی زمانی، شکست خورد. همچنین از آن شکست، درس گرفتیم و در روزهای آینده درس‌های بیشتری را نیز خواهید گرفت. با برداشتن قدم هایی که در بالا ذکر شد، می توانیم از اتفاقات مشابه جلوگیری کنیم. با تشکر از اعضای شبکه استلار و همکاران که کمک کردند این شبکه سریع‌ تر آنلاین شود و به کار خود ادامه دهد.

 

آپدیت: توقف شبکه در تاریخ ۱۵ می باعث شد که شبکه در وضعیت شکننده قرار گیرد و تنها چهار اعتبارسنج مرکزی باقی بمانند. پس از آن یک مشکل کوتاه دیگر داشتیم که دو کواروم دیگر دارای هماهنگی کافی با دو کواروم دیگر نبودند. شبکه مدت کوتاهی تا زمانی که آن را تعمیر کنیم، متوقف شد.