|

دلیل اختلال در کلادفلر و از کار افتادن سرویس‌های محبوب دنیا چه بود؟

کلادفلر اعلام کرد که شبکه‌اش با «اختلال جدی در تحویل ترافیک هسته‌ای» مواجه شده است. طبق گزارش رسمی شرکت، دلیل این بحران فایل پیکربندی خودکاری بود که برای مدیریت ترافیک ربات‌ها تولید شده و اندازه آن ناگهان از حد قابل‌پردازش فراتر رفته بود. نرم‌افزارهای مسیریابی ترافیک نتوانستند فایل را بارگذاری کنند و زنجیره‌ای از خطاها سیستم را از کار انداخت.

دلیل اختلال در کلادفلر و از کار افتادن سرویس‌های محبوب دنیا چه بود؟

به گزارش گروه رسانه‌ای شرق،

از بامداد سه‌شنبه ۱۸ نوامبر ۲۰۲۵ اینترنت جهانی با یکی از گسترده‌ترین اختلال‌های سال‌های اخیر روبه‌رو شد؛ اختلالی که نه ناشی از حمله سایبری بود و نه نقص زیرساخت کشورها، بلکه از قلب یکی از بزرگ‌ترین تأمین‌کنندگان خدمات وب جهان، Cloudflare آغاز شد. این حادثه نشان داد که شبکه جهانی تنها به چند شرکت محدود متکی است و سقوط یکی از این ستون‌ها می‌تواند چه بر سر اینترنت بیاورد. 

ماجرا چه بود؟

Cloudflare در ساعت 11:20 UTC اعلام کرد که شبکه‌اش با «اختلال جدی در تحویل ترافیک هسته‌ای» مواجه شده است. طبق گزارش رسمی شرکت، دلیل این بحران فایل پیکربندی خودکاری بود که برای مدیریت ترافیک ربات‌ها تولید شده و اندازه آن ناگهان از حد قابل‌پردازش فراتر رفته بود. نرم‌افزارهای مسیریابی ترافیک نتوانستند فایل را بارگذاری کنند و زنجیره‌ای از خطاها سیستم را از کار انداخت. کلادفلر صراحتاً اعلام کرد هیچ نشانه‌ای از حمله سایبری دیده نشده است.
متیو پرینس، هم‌بنیان‌گذار و مدیرعامل شرکت کلافلر، در وبلاگ رسمی خود توضیح داده که برخلاف شایعات اولیه، علت مشکل نه حمله سایبری، نه نقص DNS و نه حمله DDoS گسترده بود. این بحران در نتیجه یک خطای داخلی در سیستم مدیریت بات (Bot Management) رخ داده که باعث شده حافظه سیستم پر شود و بخش‌های حیاتی پردازش ترافیک از کار بیفتند.
به گفته او، تغییر اخیر در مجوزهای پایگاه داده ClickHouse مسئول تولید فایل‌های پیکربندی باعث شد فایل اصلی تعداد زیادی ردیف تکراری داشته باشد و از محدودیت حافظه تعیین‌شده عبور کند.
Cloudflare که نزدیک به ۲۰ درصد ترافیک اینترنت جهان را مدیریت می‌کند، ابزار Bot Management را برای شناسایی خزنده‌ها و جلوگیری از فعالیت‌های غیرمجاز به کار می‌گیرد. این ابزار برای تشخیص ترافیک خودکار، به یک فایل پیکربندی دائماً به‌روز وابسته است.
پرینس توضیح می‌دهد: «مدل یادگیری ماشینی پشت سیستم مدیریت بات، به‌طور مداوم این فایل را به‌روزرسانی می‌کند. اما تغییر اخیر در نحوه پردازش درخواست‌های پایگاه داده باعث شد تعداد زیادی ردیف تکراری ایجاد شود و فایل به سرعت بزرگ‌تر از حد تعیین‌شده شود.»
وقتی این فایل بزرگ به سیستم اصلی پراکسی رسید، پردازش ترافیک وابسته به ماژول بات مختل شد. در نتیجه، شرکت‌ها و سایت‌هایی که از قوانین Cloudflare برای مسدود کردن بات‌ها استفاده می‌کردند، ترافیک واقعی کاربران را به اشتباه مسدود کردند. مشتریانی که از این قوانین استفاده نمی‌کردند، توانستند بدون مشکل آنلاین بمانند.

دامنه اختلال چقدر گسترده بود؟

به دنبال این اتفاق برخی از سرویس‌های مهم از دسترس کاربران خارج شد. از حدود ۶:۳۰ صبح به وقت شرق آمریکا، رسانه‌ها و کاربران شروع به گزارش خطاهای دسترسی ، کندی و از دسترس خارج شدن سایت‌ها کردند.
فهرست سرویس‌های تحت‌تأثیر هم سرویس‌های مهم و پرکاربر بودند:
X (توییتر سابق)
OpenAI و ChatGPT
Spotify
Canva
Zoom، Teams و سرویس‌های ویدیوکنفرانس
Coinbase و برخی سرویس‌های مالی و رمزارز
صدها هزار وب‌سایت کوچک و بزرگ در اروپا، آمریکا و آسیا
در اروپا، رسانه‌های بریتانیا گزارش دادند که کسب‌وکارهای کوچک و فروشگاه‌های آنلاین از کار افتاده‌اند. در آمریکا و استرالیا نیز موجی از اختلال در دسترسی به سرویس‌ها ثبت شد.
Cloudflare حدود ۱۴:۳۰ UTC اعلام کرد که «ترافیک هسته‌ای» به حالت عادی برگشته، اما سرویس‌های مدیریتی و احراز هویت تا ساعت ۱۷:۰۰ UTC هم با مشکل روبه‌رو بودند.

چرا این اختلال مهم بود؟

Cloudflare پشت نزدیک به ۲۰ درصد وب‌سایت‌های جهان ایستاده است. این یعنی هر بار Cloudflare عطسه کند، اینترنت جهان دچار تب می‌شود.
در این حادثه نه یک دیتاسنتر، نه یک کشور و نه حتی یک قاره، بلکه ستون اصلی تحویل محتوا در سراسر جهان دچار نقص شد. به زبان ساده‌تر:
وقتی Cloudflare می‌افتد، دکمه «آف» اینترنت جهانی فشرده می‌شود.

کارشناسان چه می‌گویند؟

رسانه‌ها و تحلیلگران فناوری در مورد پیامدهای این اتفاق یک نقطه‌نظر مشترک دارند: اینترنت بیش از حد متمرکز شده است.
گاردین نوشت این حادثه نشان می‌دهد که «وابستگی جهانی به تعداد بسیار کمی ارائه‌دهنده زیرساخت اینترنت، یک ریسک ساختاری جدی است.» براساس گزارش این روزنامه «اینترنت به ظاهر غیرمتمرکز است، اما در عمل به چند ستون بزرگ مثل Cloudflare، AWS و Akamai وابسته است.»
برخی کارشناسان فناوری با اشاره به اختلال خدماتی مانند Turnstile(ابزار احراز هویت Cloudflare که باعث شد حتی ورود کاربران به داشبورد شرکت‌ها متوقف شود) می‌گویند: «نقص یک ابزار امنیتی محلی، می‌تواند زنجیره‌ای از سرویس‌های جهانی را هم زمین‌گیر کند.»
تحلیلگران حوزه امنیت سایبری نیز هشدار داده‌اند که این خطر حتی بدون حمله هم وجود دارد: «تنها کافی است یک خط پیکربندی اشتباه منتشر شود تا بخش بزرگی از اینترنت خاموش شود.»

این حادثه چه هشداری می‌دهد؟

1. شکنندگی ساختار اینترنت: اینترنت یک شبکه غیرمتمرکز به‌ظاهر مقاوم است، اما در عمل روی چند نقطه حساس تکیه دارد، نقاطی مثل Cloudflare، AWS یا Akamai.
2. وابستگی خطرناک اقتصاد دیجیتال: از بانک‌ها تا پلتفرم‌های ارتباطی، تجارت الکترونیک، رسانه‌ها و حتی سرویس‌های دولتی بعضاً بدون Cloudflare نمی‌توانند کار کنند.
3. نیاز به تنوع در ارائه‌دهندگان زیرساخت: کارشناسان پیشنهاد می‌کنند که سرویس‌های اینترنتی از «تنوع در CDN، مسیر‌دهنده‌ها و لایه‌های امنیتی» استفاده کنند تا یک خطا، کل سیستم را از کار نیندازد.
اختلال ۱۸ نوامبر ۲۰۲۵ کلادفلر شاید فقط چند ساعت طول کشید، اما یک حقیقت را به‌طور خیره‌کننده‌ای روشن کرد:
یک اشتباه یا خطا می‌‌تواند شبکه اینترنت جهانی را خاموش کند. 
این حادثه زنگ خطری برای آینده اینترنت است؛ آینده‌ای که در آن باید تعادلی تازه میان سرعت، مقیاس، امنیت و تاب‌آوری ایجاد شود. Cloudflare قول داده که این ساختار را بازطراحی کند، اما این پرسش باقی است:
اگر فردا یکی دیگر از ستون‌های اینترنت بلغزد، جهان دیجیتال چقدر آماده است؟

آخرین اخبار فناوری را از طریق این لینک پیگیری کنید.