به گزارش اکوایران، جادی میرمیرانی، ملقب به «جادی»، برنامه‌نویس و فعال حوزه تکنولوژی به توضیحاتی درخصوص هوش مصنوعی جدید چینی‌ها، «دیپ‌سیک» (DeepSeek) در یوتیوب پرداخته است.

او این مدل جدید را به سه دلیل «آزاد بودن»، «درست شدن با منابع کمتر» و «قابل استفاده بودن با منابع کمتر» چند قدم جلوتر از راهی دانست که تا الان هوش‌های مصنوعی طی کرده‌اند. البته جادی در ابتدای ویدیو خودش عنوان می‌کند که «یادمون نره که مدل چینی بخصوص برای ما یه گیرهای حادتری هم ممکن است داشته باشد.»

خبر مرتبط
هوش مصنوعی در دوئل جهانی؛ «دیپ‌سیک» چین علیه «چت جی‌پی‌تی» آمریکا

اکوایران: مدل‌های هوش مصنوعی استارتاپ چینی دیپ‌سیک نه‌تنها از نظر عملکرد قابل مقایسه با بهترین چت‌بات‌های هوش مصنوعی جهان هستند، بلکه به‌نظر می‌رسد هزینه ایجاد آن‌ها نیز بخش کوچکی از سرمایه‌هایی است که در سایر نقاط دنیا برای تولید بهترین مدل‌های هوش مصنوعی صرف می‌شود.

نگاهی به مدل چینی هوش مصنوعی

در این ویدیو، جادی میرمیرانی به معرفی دیپ‌سیک و ویژگی‌های آن می‌پردارد: دیپ‌سیک یک مدل زبانی بزرگ (Large Language Model) است که به عنوان رقیب چت جی‌پی‌تی شناخته می‌شود و از چین آمده است. این مدل بر پایه شبکه‌های عصبی بنا شده و از سال ۲۰۱۷ به بعد، ایده‌های مرتبط با زبان متنی به کار گرفته شده است. 

او ادامه می‌دهد: مدل‌های زبانی بزرگ به گونه‌ای طراحی شده‌اند که با استفاده از داده‌های بسیار زیاد، می‌توانند الگوهای زبانی را یاد بگیرند و پیش‌بینی کنند که کلمات بعدی در یک جمله چه خواهند بود. این تکنولوژی به نام هوش مصنوعی تولید کننده (Generative AI) شناخته می‌شود و به دلیل نیاز به پردازش داده‌های کلان، از واحدهای پردازش گرافیکی (GPU) استفاده می‌کند که به طور همزمان می‌توانند محاسبات زیادی را انجام دهند.

دیپ‌سیک به عنوان یک کمپانی جدید، با استفاده از تعداد بسیار کمتری GPU نسبت به رقبای خود، مدل‌هایی را تولید کرده که عملکرد بهتری دارند. این شرکت همچنین نرم‌افزارهای آزاد (Open Source) را منتشر کرده و مقالات دقیقی را در مورد کارکردهای مدل‌های خود ارائه داده است. 

در نهایت، جادی تأکید می‌کند که کاربران باید از این ابزارهای جدید بهره‌برداری کنند و به یادگیری و استفاده از آن‌ها بپردازند، زیرا این تکنولوژی‌ها به تازگی در دسترس قرار گرفته‌اند و می‌توانند به طور قابل توجهی در آینده تأثیرگذار باشند.

در این ویدیو، او به بررسی و تحلیل مدل زبانی دیپ‌سیک و ویژگی‌های آن نیز پرداخته است. دیپسیک به عنوان یک رقیب برای مدل‌های معروفی مانند جی‌پی‌تی معرفی می‌شود و به دلیل استفاده از تعداد کمتری GPU و منابع تحقیقاتی، توانسته است مدل‌هایی با عملکرد بهتر و هزینه کمتر ارائه دهد. این مدل به طور خاص به دلیل استفاده از ۶۷۱ میلیارد پارامتر، توانایی بالایی در پردازش داده‌ها دارد، اما می‌تواند تنها با ۳۷ میلیارد پارامتر به سوالات پاسخ دهد.

مدل دیپ‌سیک شامل نسخه‌های مختلفی است، از جمله آر وان که به عنوان یک مدل استدلالی شناخته می‌شود و به طور خاص برای انجام محاسبات بهینه‌سازی شده است. این مدل‌ها به صورت اوپن سورس منتشر شده‌اند و کاربران می‌توانند به راحتی به مقالات علمی و مدل‌های آن‌ها دسترسی پیدا کنند.

نکته قابل توجه این است که دیپسیک با کاهش تعداد اعشار در محاسبات و بهینه‌سازی فرآیندها، هزینه‌های اجرای خود را به طور قابل توجهی کاهش داده است. همچنین، این مدل به کاربران اجازه می‌دهد تا بدون نیاز به زیرساخت‌های سنگین، به راحتی از آن استفاده کنند.

خبر مرتبط
«دیپ سیک» چیست و چطور دنیای هوش مصنوعی را به‌هم ریخت؟

اکوایران: هوش مصنوعی دیپ سیک روز گذشته سبب ریزش شدید شرکت‌های تکنولوژی در آمریکا شد.

گام چین به سوی دموکراتیزه کردن هوش مصنوعی

در نهایت، جادی میرمیرانی به این نکته اشاره می‌کند که دیپسیک می‌تواند به دموکراتیزه کردن دسترسی به تکنولوژی‌های هوش مصنوعی کمک کند و به شرکت‌ها و کشورها این امکان را می‌دهد که با سرمایه‌گذاری کمتری به مدل‌های مشابه دست یابند. این تحولات می‌تواند تأثیرات قابل توجهی بر روی بازار و صنعت هوش مصنوعی داشته باشد.

این فعال حوزه تکنولوژی معتقد است: احتمالا نسخه‌های آینده آن امکانات پیشرفته‌تری در پردازش و تحلیل داده ارائه دهند. این پیشرفت‌ها نه تنها بر صنایع فناوری اطلاعات تأثیر خواهد گذاشت، بلکه در حوزه‌هایی مانند آموزش، ترجمه و تولید محتوا نیز نقش مهمی ایفا خواهد کرد.

با توجه به رقابت فشرده میان شرکت‌های بزرگ فناوری، باید دید که آیا دیپ‌سیک قادر خواهد بود جایگاهی پایدار در این حوزه به دست آورد یا همچنان تحت سایه رقبای غربی خود باقی خواهد ماند.