شوک بزرگ دیپ‌سیک به غول‌های هوش مصنوعی آمریکا

یک شرکت کمتر شناخته‌شدهٔ چینی هنگامی که مدل هوش مصنوعی دیپ‌سیک (DeepSeek) را معرفی کرد، مدلی که به نظر می‌رسد با پیشرفته‌ترین مدل‌های اُپن‌اِی‌آی (OpenAI) رقابت می‌کند، اما هزینهٔ طراحی و ساخت آن بسیار کمتر بوده است، دنیای فناوری را شگفت‌زده کرد.

الآن مدتی است که در دنیای فناوری مرتب از این ابداع حرف می‌زنند. سرمایه‌گذاران برتر صنعت فناوری در آمریکا در آغاز عملکرد سهام شرکت اِن‌ویدیا [Nvidia، سازندهٔ نیم‌رساناها، از جمله برای کامپیوترهای پیشرفته] را با نگرانی زیر نظر داشتند. سپس ناله و زاری کردند که این «لحظهٔ اسپوتینک» [اشاره به نگرانی دنیای سرمایه‌داری از اینکه نخستین ماهوارهٔ مصنوعی جهان را اتحاد شوروی به فضا فرستاد و از «غرب» جلو افتاد]، این به بازار آمدن مدل‌های دیپ‌سیک در هوش مصنوعی، باعث افت نزدیک به یک تریلیون دلاری ارزش شرکت‌های بزرگ فناوری شده است. جالب است که شرکت اِن‌ویدیا، که واحدهای پردازش گرافیک (GPU) پیشرفته نیز می‌سازد، بیشترین آسیب را دید و فقط در یک روز نزدیک به ۶۰۰ میلیون دلار از ارزشش را از دست داد.

واحدهای پردازش گرافیک در آغاز برای پردازش موازی داده‌های تصویری (گرافیک) ابداع شدند و نامشان هم از همین‌ جا آمده است. اما اکنون از این پردازشگرها در همهٔ عملیات محاسباتی موازی، از جمله در مدل‌های هوش مصنوعی، استفاده می‌شود. ویژگی دیگر این پیشرفت چشمگیر و نوآوری صرفه‌جویانهٔ شرکت چینی این است که این شرکت پیشرفته‌ترین مدل‌هایش را با سه تا پنج درصد هزینه‌ای ساخته است که شرکت‌های مثل اُپن‌اِی‌آی (OpenAI)، آنتروپیک (Anthropic)، گوگل، متا و جز اینها خرج کرده‌اند. اما از همه مهم‌تر اینکه این دستاورد به‌رغم تحریم‌های سخت‌گیرانه‌ای حاصل شده که دولت آمریکا (با حمایت هر دو حزب) بر صادرات تراشه‌های پیشرفته به چین تحمیل کرده است.

هدف اصلی اعمال این محدودیت‌ها بازداشتن چین از دسترسی به واحدهای پردازش گرافیکی پیشرفته بود، زیرا برای هر پیشرفت عمده‌ای در هوش مصنوعی استفاده از چنین تراشه‌هایی ضروری است. سام آلتمن، کارشناس برجستهٔ اُپن‌اِی‌آی، در سفر سال گذشته‌اش به هند مدعی شده بود که هر تلاشی برای هم‌ترازی فنی با پیشرفت‌های هوش مصنوعی شرکت‌های بزرگ فناوری آمریکا در ساخت مدل‌های پایه‌یی هوش مصنوعی با سرمایه‌گذاری‌های کوچک و تیم‌های بسیار محدود ”کاملاً بیهوده” است و امکان موفقیت ندارد. ناندان نیلکانی، چهره سرشناس فناوری هند، نیز کم و بیش همین استدلال را کرده بود که هند نباید به ساخت مدل‌های پایه‌یی هوش مصنوعی بپردازد، بلکه فقط باید از آنها در تولیداتش بهره بگیرد و پیشتازی در این رشتهٔ فنی را به‌طور کامل به آمریکا بسپارد. البته نظر او با مخالفت شدید آراویند سریینیواس، یکی از بنیان‌گذاران و مدیرعامل شرکت هوش مصنوعی پرپلکسیتی (Perplexity)، روبه‌رو شد.

اکنون روشن شده است که سم آلتمن کاملاً اشتباه می‌کرد. دیپ‌سیک نه‌فقط توانست با بودجه‌ای کم مدلی بسازد که توانایی رقابت با شرکت‌هایی را دارد که صدها میلیون دلار در آنها سرمایه‌گذاری شده است، بلکه این کامیابی را با سخت‌افزاری به دست آورد که اصولاً برای محدود کردن چنین پیشرفت‌هایی “طراحی شده بود”. اِن‌ویدیا تراشه‌های اچ-۸۰۰ را مخصوص بازار چین ساخته بود و قرار بود مانعی در راه ابداع چنان مدل‌های هوش مصنوعی در آن کشور باشد. با این حال، دنیای فناوری اکنون، هرچند دیرهنگام، به این واقعیت تاریخی ساده پی برده است که صرفاً با مجموعه‌ای از محدودیت‌های تجاری نمی‌توان جلوی پیشرفت علم و فناوری را گرفت.

مدل‌های هوش مصنوعی که در اینجا دربارهٔ آنها صحبت می‌کنیم چَت‌بات‌های [شبیه‌سازهای گفت‌وگوی هوشمند] چَت‌جی‌پی‌تی (ChatGPT) یا دیپ‌سیک (DeepSeek) نیستند که به پرسش‌های کاربر پاسخ می‌دهند، خلاصه‌هایی مناسب از موضوع مورد نظر ارائه می‌دهند، یا حتی چکیده‌هایی از پژوهش‌ها تولید می‌کنند. همهٔ اینها را می‌توان نسخه‌های پیشرفته‌تر موتور جست‌وجوی گوگل دانست. این نوع ابزارها، پس از اینکه کمابیش تمام محتوای اینترنت را “می‌بلعند” (داده‌های عظیمی به آنها خورانده می‌شود)، دیگر کار چندان بیشتری برای تولید بینش جدید نمی‌توانند بکنند. اما مدل‌های جدید، ضمن آنکه همچنان بر پایهٔ مدل‌های زبانی بزرگ ال‌ال‌ام‌اس (LLMs) ساخته شده‌اند، یعنی همان پایه‌ای که چت‌جی‌پی‌تی و همتایانش بر آن استوارند، شامل “مدل‌های استدلالی” بر شالودهٔ الگوهای یادگیری پیشرفته‌اند. همچنین، گفته می‌شود که راه دستیابی به “هوش مصنوعی عمومی” (AGI)، همتای ماشینی هوش زیستی انسان، طراحی و ابداع همین “مدل‌های استدلالی” است، حتی اگر ابداع نهایی “هوش مصنوعی عمومی” مورد نظر آن‌قدرها هم نزدیک نیست که سام آلتمن و هم‌قطارانش در حوزهٔ هوش مصنوعی می‌خواهند ما باور کنیم. پیشرفت‌های جدیدی که درباره آنها صحبت می‌کنیم در حوزهٔ مدل‌های استدلالی است و در اینجاست که دیپ‌سیک توانسته است مدل‌هایی بسازد که جلوتر از توانایی‌های غول‌های دیجیتال آمریکا یا دست کم هم‌تراز با آنها است. یا، همان‌طور که در یک عنوان خبری دربارهٔ مدل‌های دیپ‌سیک آمده بود: “آیا چین گوی سبقت در هوش مصنوعی را از آمریکا ربود؟”

آنچه دنیای فناوری را شگفت‌زده کرده این نیست که چین به پای ابداع و توسعهٔ هوش مصنوعی غول‌های فناوری آمریکا رسیده است، بلکه این واقعیت است که شرکتی با ارزش فقط هشت میلیارد دلار، بدون هیچ دستاورد پیشین در این حوزه، توانسته است با هزینه‌ای ناچیز به هدف برسد. این شرکت چینی فقط در دو ماه و با صرف کمتر از شش میلیون دلار مدلی در حدّ مدل‌های اُپن‌اِی‌آی ساخت.

افزون بر این، این موفقیت با کاربرد تراشه‌های محدودشدهٔ اچ-۸۰۰ اِن‌ویدیا به دست آمد، تراشه‌ای که مطابق با محدودیت‌های صادراتی آمریکا به‌خصوص برای چین طراحی شده است تا آن کشور را از پیشرفت در حوزهٔ هوش مصنوعی بازدارد. برای آنهایی که به هر ادعای چین در حوزهٔ فناوری با دیدهٔ شک و تردید نگاه می‌کنند باید گفت که دیپ‌سیک نه‌‌فقط این مدل را به ‌صورت “متن باز” (Open Source) منتشر کرده [یعنی همه به کُدهای برنامه‌نویسی آن آزادانه دسترسی دارند]، بلکه نوشتارهای علمی مفصلی نیز منتشر کرده است که در آنها کار تیمشان مو به مو توضیح داده شده است.

ببینیم حامیان و گردانندگان شرکت دیپ‌سیک کیستند و چه کسانی آن را اداره می‌کنند. حامیان دیپ‌سیک گروهی‌اند که در دنیای مالی به آنها کوانت (Quant) می‌گویند. کوانت‌ها دانش‌آموخته‌های رشته‌های ریاضیات و مدل‌سازی و برنامه‌نویسی‌اند که در عرصهٔ مالی فعالیت می‌کنند. اینها همان‌هایی‌اند که مسئول فروریزی وال استریت در سال ۲۰۰۸ شناخته می‌شوند، بحرانی که مربوط بود به فاجعهٔ دادن وام‌های مسکن با نرخ بیشتر به کسانی که به احتمال زیاد از عهدهٔ بازپرداخت وام برنمی‌آمدند.

اگرچه کوانت‌ها پس از ریزش بازارهای مالی در سال ۲۰۰۸ تا حدّی بی‌اعتبار شدند، با وجود این دنیای مالی بدون آنها نمی‌تواند به کارش ادامه دهد. اما در چین بازارهای مالی زیر نظارت‌های سخت‌گیرانه‌ای هستند. بنیان‌گذار دیپ‌سیک فردی به نام لیانگ ون‌فِنگ است که پس از آنکه در سال ۲۰۱۲ زیان بزرگی متحمل شد که در آن حدود یک‌سوم از ارزش دوازده میلیارد دلاری شرکتش را از دست داد، تصمیم گرفت که بخشی از سرمایه‌اش و تیم کوانت‌هایش را به کار هوش مصنوعی بیندازد.

این طور نیست که دیپ‌سیک ریاضیاتی کاملاً جدید برای حل مسائل هوش مصنوعی پیدا کرده باشد. آنها به‌جای اینکه فقط پول و توان محاسباتی را به این کار بیندازند تصمیم گرفتند با مهندسی هوشمندانه دو مدل جدید بسازند و در اختیار همگان بگذارند. این مدل‌ها، که کاردان شناخته‌شده‌ای در این حوزه به نام جفری امانوئل (و دیگران) آنها را بررسی کرده است، “از نظر عملکرد در حدّ جهانی‌اند و با بهترین مدل‌های اُپن‌اِی‌آی و آنتروپیک برابری می‌کنند. حتی از مدل‌های متا لاما۳ (Metal Llama3) و دیگر مدل‌های متن ‌باز کوچک‌تر مانند میسترال (Mistral) پیشی گرفته‌اند. این مدل‌ها را دیپ‌سیک-وی‌۳ (V3)- در مقابل ج‌پی‌تی-۴اُ (GPT-4o) و کلاد ۳/۵ سونت (Claude 3.5 Sonnet)- و دیپ‌سیک-آر۱ (DeepSeek-R1)، در مقابل مدل O1 اُپن‌اِی‌آی، می‌نامند.” هزینهٔ ابداع چه مقدار بوده است؟ حداکثر پنج درصد آنچه دیگران هزینه کرده‌اند یا می‌بایست بکنند. گمان جفری امانوئل این است که کارآمدی دیپ‌سیک ۴۵ تا ۵۰ برابر دیگر کارپایه‌های پیشرفتهٔ هوش مصنوعی است.

مدل‌های دیپ‌سیک نه‌فقط در دسترس آزادانهٔ همگان قرار داده شده، بلکه با مجوز ام‌آی‌تی (MIT) به‌صورت مدل‌های متن باز منتشر شده و هسته‌هایی اصلی مدل نیز در گیت‌هاب (GitHub) گذاشته شده است. [گیت‌هاب شبکه‌ای اجتماعی برای همکاری و هم‌رسانی برنامه‌نویسان است.] افزون بر این، تیم دیپ‌سیک دو گزارش فنی جامع منتشر کرده که در آن همهٔ مراحل کار توضیح داده شده است. بنابراین، مدل‌ها، تئوری کار، و شیوهٔ بررسی مسائل و حل آنها همه به نحوی تنظیم شده است که دیگران نه‌فقط می‌توانند کار ابداع‌کنندگان را دنبال کنند و از آن بهره بگیرند، بلکه می‌توانند آن را در کامپیوترهای خودشان بازتولید و اجرا کنند. شوکی که دیپ‌سیک به بازار وارد کرد سه پیامد مهم برای دنیای دیجیتال دارد. نخست اینکه قیمت سهام اِن‌ویدیا، یکی از بزرگ‌ترین بهره‌بَران از رونق هوش مصنوعی، کاهش چشمگیری می‌یابد. این روند هم‌اکنون کاملاً آشکار شده است. دوم اینکه بازیگران بسیار بیشتری وارد مسابقه در حوزهٔ هوش مصنوعی می‌شوند، چون حالا می‌دانند که هزینهٔ ورود به این رقابت آن‌گونه که غول‌های فناوری ادعا می‌کنند چندان زیاد نیست. درست همان‌طور که در دگرگشت [فرگشت یا تکامل] گونه‌های جانوری رخ داده است، پیروزی در این رقابت فقط از آنِ بزرگ‌ترین‌ها نیست! سومین پیامد حاکی از بی‌اثر بودن تحریم‌های فناوری است. اعمال تحریم‌ها نتوانست هند را از پیشرفت هسته‌یی و فضایی بازدارد و مانع پیشرفت چین در حوزهٔ هوش مصنوعی هم نشده است.

و این همهٔ ماجرا نیست. اگر افزایش قدرت محاسباتی تنها راه بهبود مدل‌ها و جلو افتادن در بازار هوش مصنوعی نیست، پس آیا هنوز به مراکز دادهٔ کلان- که صنعت هوش مصنوعی برنامه‌ریزی کرده بود- نیاز داریم؟ خیلی از ما ابداع ریزپردازنده‌ها و انقلاب رایانه‌های شخصی (PC) را به یاد داریم. آیا لحظهٔ دیپ‌سیک ممکن است شوکی مشابه ایجاد کند؟ دنیای شرکت آی‌بی‌ام را یادتان می‌آید که اتاق‌های بسیار بزرگی برای دستگاه‌های آی‌بی‌ام می‌ساختند که نماد پیشرفت‌های محاسباتی بودند؟

همین پندار بود که باعث شد ترامپ در روز دوم ریاست‌جمهوری‌ دورهٔ جدیدش طرح پانصد میلیارد دلاری شرکت اُپن‌اِی‌آی به نام استارگیت (StarGate) را اعلام کند. این طرح شامل شبکه‌ای گسترده از مراکز داده (Data Centres) است که شمار بسیار زیادی از واحدهای پردازش گرافیک پُرقدرت (GPU) در آن گنجانده می‌شود، و تقریباً همه هم ساخت شرکت اِن‌ویدیا. این موضوع باعث شد که بحث انرژی نیز به کانون توجه‌ها کشیده است، زیرا در این مراکز داده انرژی عظیمی مصرف می‌شود. در این طرح مصرف گاز طبیعی پیش‌بینی شده که کاملاً‌ همخوان با شعار انتخاباتی ترامپ است: “حفاری کنید بچه‌ها، حفاری کنید!” روشن است که اجرای این طرح سبب افزایش انتشار گازهای گلخانه‌یی آمریکا می‌شود. در نبود چنین تقاضای فوری برای انرژی، صنعت گاز طبیعی در آمریکا در رقابت با انرژی خورشیدی و بادی مشکل خواهد داشت، زیرا هزینهٔ تولید این انرژی‌های نوین بسیار کم شده و همچنان رو به کاهش دارد. از این رو، دیپ‌سیک نه‌فقط مفهوم “بزرگ‌تر بهتر است” را بی‌اعتبار کرده، بلکه تهدید فزایندهٔ انتشار گازهای گلخانه‌ای آمریکا را نیز کاهش داده است.

به گفتهٔ فیلسوفی نامدار: «ده‌ها سال ممکن است بدون هیچ رخدادی بگذرد، اما گاهی در یک هفته به اندازهٔ یک دهه دگرگونی رخ می‌دهد.» به نظر می‌رسد که این یکی از آن بزنگاه‌ها باشد. دست‌کم در سپهر هوش مصنوعی.

به نقل از «نامۀ مردم»، شمارهٔ ۱۲۲۸، ۶ اسفند ۱۴۰۳

چین سریع‌ترین قطار جهان را می‌سازد

چین سریع‌ترین نمونه اولیه قطار پرسرعت جهان را با سرعت ۴۵۰ کیلومتر در ساعت آزمایش می‌کند. به گزارش ایسنا، چین پیشتازی خود را در راه‌آهن سریع‌السیر با سه قطار برتر تثبیت خواهد کرد. به نقل از آی‌ای، چین در حال نزدیک‌تر شدن به بهره‌برداری از قطاری است که می‌تواند سریع‌ترین قطار پرسرعت جهان شود. به ... چین سریع‌ترین قطار جهان را می‌سازد

ادامه

اسپانیا, جهان, چین, خبر, دانش, ژاپن, شرق آسیا, فرانسه

چین ماهواره‌های جدیدی را برای توسعه اینترنت به فضا فرستاد

چین امروز سه‌شنبه، گروه جدیدی از ماهواره‌های در مدار پایین زمین را از پایگاه فضایی ونچانگ در استان هاینان با یک موشک لانگ مارچ -۸ به فضا پرتاب کرد. به گزارش عصر سه‌شنبه ایرنا از خبرگزاری تلویزیون مرکزی چین، چین امروز گروهی از ماهواره‌های در مدار پایین زمین را از پایگاه فضایی ونچانگ در استان ... چین ماهواره‌های جدیدی را برای توسعه اینترنت به فضا فرستاد

ادامه

جهان, چین, خبر, دانش, شرق آسیا

پکن: حملات سایبری به «دیپ‌سیک» بیش از ۱۰۰ برابر افزایش پیدا کرده است

شرکت پشتیبان دیپ سیک(Deep seek) دستیار هوش مصنوعی چینی اعلام کرد که پس از معرفی این استارتآپ چینی، حملات سایبری به آن بیش از ۱۰۰ برابر افزایش پیدا کرده است. به گزارش روز جمعه ایرنا از نشریه گلوبال‌تایمز، شرکت امنیت سایبری چینی ایکس لب(XLab) اعلام کرد که حملات سایبری به استارت‌آپ هوش مصنوعی چینی دیپ ... پکن: حملات سایبری به «دیپ‌سیک» بیش از ۱۰۰ برابر افزایش پیدا کرده است

ادامه

جهان, چین, خبر, دانش, شرق آسیا

خط‌ و نشان چین با دیپ‌سیک برای آمریکا در حوزه فناوری

نخستین هوش مصنوعی متن پایه چینی‌ها با عنوان دیپ‌سیک (DeepSeek) توانسته است در مدت کوتاهی از ارائه شدن در قالب وب برای رایانه، برنامه‌‎های کاربردی در گوگل‌پلی و اپل استور آن هم به صورت رایگان به سرعت به محبوبیت برسد و نویدآور نوآوری‌های بیشتر در حوزه هوش مصنوعی به دلیل رقابت ابرقدرت‌ها بر سر آن ... خط‌ و نشان چین با دیپ‌سیک برای آمریکا در حوزه فناوری

ادامه

آمریکا, جهان, چین, دانش, ٰژئوپلیتیک, شرق آسیا, غرب, گزارش