هوش مصنوعی Gemini 3.1 Pro گوگل برای گفتن «سلام» بیش از ۱۰۰ ثانیه معطل کرد

۳ اسفند, ۱۴۰۴
۱۶:۰۴

جدیدترین مدل هوش مصنوعی گوگل در همان روزهای ابتدایی عرضه با موجی از انتقادها روبه‌رو شد؛ چرا که آزمایش‌ها نشان می‌دهد «جمینای ۳.۱ پرو» برای پاسخ به یک پیام ساده مانند «سلام» حدود ۱۰۴ ثانیه زمان صرف کرده است.
به گزارش عصر ارتباط،مدل Gemini 3.1 Pro که ۱۹ فوریه معرفی شد، با ثبت امتیاز ۷۷.۱ درصدی در معیار استدلال ARC-AGI-2 به‌عنوان یکی از قدرتمندترین مدل‌های استدلالی صنعت شناخته شد. گوگل اعلام کرده بود عملکرد این نسخه بیش از دو برابر نسخه پیشین است و جهشی مهم در توانایی‌های تحلیلی به شمار می‌رود. با این حال، تجربه کاربران اولیه تصویر متفاوتی ارائه داد.
توسعه‌دهندگان از کندی شدید، اختلال در گردش‌های کاری، وقفه‌های چندساعته و ناتوانی مدل در اجرای دستورات ساده بدون تأخیرهای چنددقیقه‌ای خبر داده‌اند. سیمون ویلیسون، برنامه‌نویس بریتانیایی، تنها ساعاتی پس از عرضه اعلام کرد پاسخ «سلام» را پس از ۱۰۴ ثانیه دریافت کرده است. همزمان، انجمن‌های تخصصی مملو از گزارش‌هایی درباره پیام‌های خطای مهلت منقضی‌شده و عملکرد کند این مدل شد.
مشخصات فنی Gemini 3.1 Pro در ظاهر چشمگیر است؛ پنجره ورودی یک میلیون توکنی، خروجی ۶۴ هزار توکن و تمرکز ویژه بر حل مسائل پیچیده و عملکرد عامل‌محور. اما آنچه در تبلیغات رسمی کمتر مورد اشاره قرار گرفت، نیاز این مدل به زمان پردازش طولانی برای استدلال‌های عمیق است؛ موضوعی که آن را برای توسعه تعاملی و تولید کد سریع با چالش مواجه کرده است.
در حالی که رقابت فشرده‌ای میان گوگل، آنتروپیک و اوپن‌ای‌آی بر سر کسب بالاترین امتیاز معیارهای هوش مصنوعی جریان دارد، برخی کارشناسان معتقدند تمرکز بیش از حد بر «جدول امتیازات» می‌تواند به بهای کاهش کارایی در محیط‌های واقعی تمام شود. امتیاز بالای ARC-AGI-2 نشان می‌دهد این مدل از نظر تئوریک بسیار توانمند است، اما تجربه عملی کاربران نشان می‌دهد هنوز فاصله معناداری تا بهره‌برداری روان در محیط تولید وجود دارد.
از منظر قیمت‌گذاری، هزینه دو دلار برای هر یک میلیون توکن ورودی و ۱۲ دلار برای هر یک میلیون توکن خروجی، Gemini 3.1 Pro را به گزینه‌ای ارزان‌تر نسبت به برخی رقبا تبدیل می‌کند. با این حال، توسعه‌دهندگان می‌گویند زمانی که پاسخ ساده‌ای مانند «سلام» نزدیک به دو دقیقه طول می‌کشد، مزیت قیمتی عملاً بی‌اثر می‌شود.
به باور تحلیلگران، مسئله اصلی تنها کندی نیست؛ بلکه شکاف میان انتظارات ایجادشده و تجربه واقعی کاربران است. توسعه‌دهندگانی که با امید ارتقای عملکرد به نسخه جدید مهاجرت کردند، حالا با مدلی مواجه شده‌اند که در انجام ابتدایی‌ترین وظایف نیز تأخیر قابل توجهی دارد؛ موضوعی که می‌تواند بر اعتماد به اکوسیستم هوش مصنوعی گوگل تأثیر بگذارد.