
یک شرکت کمتر شناختهشدهٔ چینی هنگامی که مدل هوش مصنوعی دیپسیک (DeepSeek) را معرفی کرد، مدلی که به نظر میرسد با پیشرفتهترین مدلهای اُپناِیآی (OpenAI) رقابت میکند، اما هزینهٔ طراحی و ساخت آن بسیار کمتر بوده است، دنیای فناوری را شگفتزده کرد.
الآن مدتی است که در دنیای فناوری مرتب از این ابداع حرف میزنند. سرمایهگذاران برتر صنعت فناوری در آمریکا در آغاز عملکرد سهام شرکت اِنویدیا [Nvidia، سازندهٔ نیمرساناها، از جمله برای کامپیوترهای پیشرفته] را با نگرانی زیر نظر داشتند. سپس ناله و زاری کردند که این «لحظهٔ اسپوتینک» [اشاره به نگرانی دنیای سرمایهداری از اینکه نخستین ماهوارهٔ مصنوعی جهان را اتحاد شوروی به فضا فرستاد و از «غرب» جلو افتاد]، این به بازار آمدن مدلهای دیپسیک در هوش مصنوعی، باعث افت نزدیک به یک تریلیون دلاری ارزش شرکتهای بزرگ فناوری شده است. جالب است که شرکت اِنویدیا، که واحدهای پردازش گرافیک (GPU) پیشرفته نیز میسازد، بیشترین آسیب را دید و فقط در یک روز نزدیک به ۶۰۰ میلیون دلار از ارزشش را از دست داد.
واحدهای پردازش گرافیک در آغاز برای پردازش موازی دادههای تصویری (گرافیک) ابداع شدند و نامشان هم از همین جا آمده است. اما اکنون از این پردازشگرها در همهٔ عملیات محاسباتی موازی، از جمله در مدلهای هوش مصنوعی، استفاده میشود. ویژگی دیگر این پیشرفت چشمگیر و نوآوری صرفهجویانهٔ شرکت چینی این است که این شرکت پیشرفتهترین مدلهایش را با سه تا پنج درصد هزینهای ساخته است که شرکتهای مثل اُپناِیآی (OpenAI)، آنتروپیک (Anthropic)، گوگل، متا و جز اینها خرج کردهاند. اما از همه مهمتر اینکه این دستاورد بهرغم تحریمهای سختگیرانهای حاصل شده که دولت آمریکا (با حمایت هر دو حزب) بر صادرات تراشههای پیشرفته به چین تحمیل کرده است.
هدف اصلی اعمال این محدودیتها بازداشتن چین از دسترسی به واحدهای پردازش گرافیکی پیشرفته بود، زیرا برای هر پیشرفت عمدهای در هوش مصنوعی استفاده از چنین تراشههایی ضروری است. سام آلتمن، کارشناس برجستهٔ اُپناِیآی، در سفر سال گذشتهاش به هند مدعی شده بود که هر تلاشی برای همترازی فنی با پیشرفتهای هوش مصنوعی شرکتهای بزرگ فناوری آمریکا در ساخت مدلهای پایهیی هوش مصنوعی با سرمایهگذاریهای کوچک و تیمهای بسیار محدود ”کاملاً بیهوده” است و امکان موفقیت ندارد. ناندان نیلکانی، چهره سرشناس فناوری هند، نیز کم و بیش همین استدلال را کرده بود که هند نباید به ساخت مدلهای پایهیی هوش مصنوعی بپردازد، بلکه فقط باید از آنها در تولیداتش بهره بگیرد و پیشتازی در این رشتهٔ فنی را بهطور کامل به آمریکا بسپارد. البته نظر او با مخالفت شدید آراویند سریینیواس، یکی از بنیانگذاران و مدیرعامل شرکت هوش مصنوعی پرپلکسیتی (Perplexity)، روبهرو شد.
اکنون روشن شده است که سم آلتمن کاملاً اشتباه میکرد. دیپسیک نهفقط توانست با بودجهای کم مدلی بسازد که توانایی رقابت با شرکتهایی را دارد که صدها میلیون دلار در آنها سرمایهگذاری شده است، بلکه این کامیابی را با سختافزاری به دست آورد که اصولاً برای محدود کردن چنین پیشرفتهایی “طراحی شده بود”. اِنویدیا تراشههای اچ-۸۰۰ را مخصوص بازار چین ساخته بود و قرار بود مانعی در راه ابداع چنان مدلهای هوش مصنوعی در آن کشور باشد. با این حال، دنیای فناوری اکنون، هرچند دیرهنگام، به این واقعیت تاریخی ساده پی برده است که صرفاً با مجموعهای از محدودیتهای تجاری نمیتوان جلوی پیشرفت علم و فناوری را گرفت.
مدلهای هوش مصنوعی که در اینجا دربارهٔ آنها صحبت میکنیم چَتباتهای [شبیهسازهای گفتوگوی هوشمند] چَتجیپیتی (ChatGPT) یا دیپسیک (DeepSeek) نیستند که به پرسشهای کاربر پاسخ میدهند، خلاصههایی مناسب از موضوع مورد نظر ارائه میدهند، یا حتی چکیدههایی از پژوهشها تولید میکنند. همهٔ اینها را میتوان نسخههای پیشرفتهتر موتور جستوجوی گوگل دانست. این نوع ابزارها، پس از اینکه کمابیش تمام محتوای اینترنت را “میبلعند” (دادههای عظیمی به آنها خورانده میشود)، دیگر کار چندان بیشتری برای تولید بینش جدید نمیتوانند بکنند. اما مدلهای جدید، ضمن آنکه همچنان بر پایهٔ مدلهای زبانی بزرگ الالاماس (LLMs) ساخته شدهاند، یعنی همان پایهای که چتجیپیتی و همتایانش بر آن استوارند، شامل “مدلهای استدلالی” بر شالودهٔ الگوهای یادگیری پیشرفتهاند. همچنین، گفته میشود که راه دستیابی به “هوش مصنوعی عمومی” (AGI)، همتای ماشینی هوش زیستی انسان، طراحی و ابداع همین “مدلهای استدلالی” است، حتی اگر ابداع نهایی “هوش مصنوعی عمومی” مورد نظر آنقدرها هم نزدیک نیست که سام آلتمن و همقطارانش در حوزهٔ هوش مصنوعی میخواهند ما باور کنیم. پیشرفتهای جدیدی که درباره آنها صحبت میکنیم در حوزهٔ مدلهای استدلالی است و در اینجاست که دیپسیک توانسته است مدلهایی بسازد که جلوتر از تواناییهای غولهای دیجیتال آمریکا یا دست کم همتراز با آنها است. یا، همانطور که در یک عنوان خبری دربارهٔ مدلهای دیپسیک آمده بود: “آیا چین گوی سبقت در هوش مصنوعی را از آمریکا ربود؟”
آنچه دنیای فناوری را شگفتزده کرده این نیست که چین به پای ابداع و توسعهٔ هوش مصنوعی غولهای فناوری آمریکا رسیده است، بلکه این واقعیت است که شرکتی با ارزش فقط هشت میلیارد دلار، بدون هیچ دستاورد پیشین در این حوزه، توانسته است با هزینهای ناچیز به هدف برسد. این شرکت چینی فقط در دو ماه و با صرف کمتر از شش میلیون دلار مدلی در حدّ مدلهای اُپناِیآی ساخت.
افزون بر این، این موفقیت با کاربرد تراشههای محدودشدهٔ اچ-۸۰۰ اِنویدیا به دست آمد، تراشهای که مطابق با محدودیتهای صادراتی آمریکا بهخصوص برای چین طراحی شده است تا آن کشور را از پیشرفت در حوزهٔ هوش مصنوعی بازدارد. برای آنهایی که به هر ادعای چین در حوزهٔ فناوری با دیدهٔ شک و تردید نگاه میکنند باید گفت که دیپسیک نهفقط این مدل را به صورت “متن باز” (Open Source) منتشر کرده [یعنی همه به کُدهای برنامهنویسی آن آزادانه دسترسی دارند]، بلکه نوشتارهای علمی مفصلی نیز منتشر کرده است که در آنها کار تیمشان مو به مو توضیح داده شده است.
ببینیم حامیان و گردانندگان شرکت دیپسیک کیستند و چه کسانی آن را اداره میکنند. حامیان دیپسیک گروهیاند که در دنیای مالی به آنها کوانت (Quant) میگویند. کوانتها دانشآموختههای رشتههای ریاضیات و مدلسازی و برنامهنویسیاند که در عرصهٔ مالی فعالیت میکنند. اینها همانهاییاند که مسئول فروریزی وال استریت در سال ۲۰۰۸ شناخته میشوند، بحرانی که مربوط بود به فاجعهٔ دادن وامهای مسکن با نرخ بیشتر به کسانی که به احتمال زیاد از عهدهٔ بازپرداخت وام برنمیآمدند.
اگرچه کوانتها پس از ریزش بازارهای مالی در سال ۲۰۰۸ تا حدّی بیاعتبار شدند، با وجود این دنیای مالی بدون آنها نمیتواند به کارش ادامه دهد. اما در چین بازارهای مالی زیر نظارتهای سختگیرانهای هستند. بنیانگذار دیپسیک فردی به نام لیانگ ونفِنگ است که پس از آنکه در سال ۲۰۱۲ زیان بزرگی متحمل شد که در آن حدود یکسوم از ارزش دوازده میلیارد دلاری شرکتش را از دست داد، تصمیم گرفت که بخشی از سرمایهاش و تیم کوانتهایش را به کار هوش مصنوعی بیندازد.
این طور نیست که دیپسیک ریاضیاتی کاملاً جدید برای حل مسائل هوش مصنوعی پیدا کرده باشد. آنها بهجای اینکه فقط پول و توان محاسباتی را به این کار بیندازند تصمیم گرفتند با مهندسی هوشمندانه دو مدل جدید بسازند و در اختیار همگان بگذارند. این مدلها، که کاردان شناختهشدهای در این حوزه به نام جفری امانوئل (و دیگران) آنها را بررسی کرده است، “از نظر عملکرد در حدّ جهانیاند و با بهترین مدلهای اُپناِیآی و آنتروپیک برابری میکنند. حتی از مدلهای متا لاما۳ (Metal Llama3) و دیگر مدلهای متن باز کوچکتر مانند میسترال (Mistral) پیشی گرفتهاند. این مدلها را دیپسیک-وی۳ (V3)- در مقابل جپیتی-۴اُ (GPT-4o) و کلاد ۳/۵ سونت (Claude 3.5 Sonnet)- و دیپسیک-آر۱ (DeepSeek-R1)، در مقابل مدل O1 اُپناِیآی، مینامند.” هزینهٔ ابداع چه مقدار بوده است؟ حداکثر پنج درصد آنچه دیگران هزینه کردهاند یا میبایست بکنند. گمان جفری امانوئل این است که کارآمدی دیپسیک ۴۵ تا ۵۰ برابر دیگر کارپایههای پیشرفتهٔ هوش مصنوعی است.
مدلهای دیپسیک نهفقط در دسترس آزادانهٔ همگان قرار داده شده، بلکه با مجوز امآیتی (MIT) بهصورت مدلهای متن باز منتشر شده و هستههایی اصلی مدل نیز در گیتهاب (GitHub) گذاشته شده است. [گیتهاب شبکهای اجتماعی برای همکاری و همرسانی برنامهنویسان است.] افزون بر این، تیم دیپسیک دو گزارش فنی جامع منتشر کرده که در آن همهٔ مراحل کار توضیح داده شده است. بنابراین، مدلها، تئوری کار، و شیوهٔ بررسی مسائل و حل آنها همه به نحوی تنظیم شده است که دیگران نهفقط میتوانند کار ابداعکنندگان را دنبال کنند و از آن بهره بگیرند، بلکه میتوانند آن را در کامپیوترهای خودشان بازتولید و اجرا کنند. شوکی که دیپسیک به بازار وارد کرد سه پیامد مهم برای دنیای دیجیتال دارد. نخست اینکه قیمت سهام اِنویدیا، یکی از بزرگترین بهرهبَران از رونق هوش مصنوعی، کاهش چشمگیری مییابد. این روند هماکنون کاملاً آشکار شده است. دوم اینکه بازیگران بسیار بیشتری وارد مسابقه در حوزهٔ هوش مصنوعی میشوند، چون حالا میدانند که هزینهٔ ورود به این رقابت آنگونه که غولهای فناوری ادعا میکنند چندان زیاد نیست. درست همانطور که در دگرگشت [فرگشت یا تکامل] گونههای جانوری رخ داده است، پیروزی در این رقابت فقط از آنِ بزرگترینها نیست! سومین پیامد حاکی از بیاثر بودن تحریمهای فناوری است. اعمال تحریمها نتوانست هند را از پیشرفت هستهیی و فضایی بازدارد و مانع پیشرفت چین در حوزهٔ هوش مصنوعی هم نشده است.
و این همهٔ ماجرا نیست. اگر افزایش قدرت محاسباتی تنها راه بهبود مدلها و جلو افتادن در بازار هوش مصنوعی نیست، پس آیا هنوز به مراکز دادهٔ کلان- که صنعت هوش مصنوعی برنامهریزی کرده بود- نیاز داریم؟ خیلی از ما ابداع ریزپردازندهها و انقلاب رایانههای شخصی (PC) را به یاد داریم. آیا لحظهٔ دیپسیک ممکن است شوکی مشابه ایجاد کند؟ دنیای شرکت آیبیام را یادتان میآید که اتاقهای بسیار بزرگی برای دستگاههای آیبیام میساختند که نماد پیشرفتهای محاسباتی بودند؟
همین پندار بود که باعث شد ترامپ در روز دوم ریاستجمهوری دورهٔ جدیدش طرح پانصد میلیارد دلاری شرکت اُپناِیآی به نام استارگیت (StarGate) را اعلام کند. این طرح شامل شبکهای گسترده از مراکز داده (Data Centres) است که شمار بسیار زیادی از واحدهای پردازش گرافیک پُرقدرت (GPU) در آن گنجانده میشود، و تقریباً همه هم ساخت شرکت اِنویدیا. این موضوع باعث شد که بحث انرژی نیز به کانون توجهها کشیده است، زیرا در این مراکز داده انرژی عظیمی مصرف میشود. در این طرح مصرف گاز طبیعی پیشبینی شده که کاملاً همخوان با شعار انتخاباتی ترامپ است: “حفاری کنید بچهها، حفاری کنید!” روشن است که اجرای این طرح سبب افزایش انتشار گازهای گلخانهیی آمریکا میشود. در نبود چنین تقاضای فوری برای انرژی، صنعت گاز طبیعی در آمریکا در رقابت با انرژی خورشیدی و بادی مشکل خواهد داشت، زیرا هزینهٔ تولید این انرژیهای نوین بسیار کم شده و همچنان رو به کاهش دارد. از این رو، دیپسیک نهفقط مفهوم “بزرگتر بهتر است” را بیاعتبار کرده، بلکه تهدید فزایندهٔ انتشار گازهای گلخانهای آمریکا را نیز کاهش داده است.
به گفتهٔ فیلسوفی نامدار: «دهها سال ممکن است بدون هیچ رخدادی بگذرد، اما گاهی در یک هفته به اندازهٔ یک دهه دگرگونی رخ میدهد.» به نظر میرسد که این یکی از آن بزنگاهها باشد. دستکم در سپهر هوش مصنوعی.
به نقل از «نامۀ مردم»، شمارهٔ ۱۲۲۸، ۶ اسفند ۱۴۰۳