جدیدترین مدل هوش مصنوعی گوگل در همان روزهای ابتدایی عرضه با موجی از انتقادها روبهرو شد؛ چرا که آزمایشها نشان میدهد «جمینای ۳.۱ پرو» برای پاسخ به یک پیام ساده مانند «سلام» حدود ۱۰۴ ثانیه زمان صرف کرده است.
به گزارش عصر ارتباط،مدل Gemini 3.1 Pro که ۱۹ فوریه معرفی شد، با ثبت امتیاز ۷۷.۱ درصدی در معیار استدلال ARC-AGI-2 بهعنوان یکی از قدرتمندترین مدلهای استدلالی صنعت شناخته شد. گوگل اعلام کرده بود عملکرد این نسخه بیش از دو برابر نسخه پیشین است و جهشی مهم در تواناییهای تحلیلی به شمار میرود. با این حال، تجربه کاربران اولیه تصویر متفاوتی ارائه داد.
توسعهدهندگان از کندی شدید، اختلال در گردشهای کاری، وقفههای چندساعته و ناتوانی مدل در اجرای دستورات ساده بدون تأخیرهای چنددقیقهای خبر دادهاند. سیمون ویلیسون، برنامهنویس بریتانیایی، تنها ساعاتی پس از عرضه اعلام کرد پاسخ «سلام» را پس از ۱۰۴ ثانیه دریافت کرده است. همزمان، انجمنهای تخصصی مملو از گزارشهایی درباره پیامهای خطای مهلت منقضیشده و عملکرد کند این مدل شد.
مشخصات فنی Gemini 3.1 Pro در ظاهر چشمگیر است؛ پنجره ورودی یک میلیون توکنی، خروجی ۶۴ هزار توکن و تمرکز ویژه بر حل مسائل پیچیده و عملکرد عاملمحور. اما آنچه در تبلیغات رسمی کمتر مورد اشاره قرار گرفت، نیاز این مدل به زمان پردازش طولانی برای استدلالهای عمیق است؛ موضوعی که آن را برای توسعه تعاملی و تولید کد سریع با چالش مواجه کرده است.
در حالی که رقابت فشردهای میان گوگل، آنتروپیک و اوپنایآی بر سر کسب بالاترین امتیاز معیارهای هوش مصنوعی جریان دارد، برخی کارشناسان معتقدند تمرکز بیش از حد بر «جدول امتیازات» میتواند به بهای کاهش کارایی در محیطهای واقعی تمام شود. امتیاز بالای ARC-AGI-2 نشان میدهد این مدل از نظر تئوریک بسیار توانمند است، اما تجربه عملی کاربران نشان میدهد هنوز فاصله معناداری تا بهرهبرداری روان در محیط تولید وجود دارد.
از منظر قیمتگذاری، هزینه دو دلار برای هر یک میلیون توکن ورودی و ۱۲ دلار برای هر یک میلیون توکن خروجی، Gemini 3.1 Pro را به گزینهای ارزانتر نسبت به برخی رقبا تبدیل میکند. با این حال، توسعهدهندگان میگویند زمانی که پاسخ سادهای مانند «سلام» نزدیک به دو دقیقه طول میکشد، مزیت قیمتی عملاً بیاثر میشود.
به باور تحلیلگران، مسئله اصلی تنها کندی نیست؛ بلکه شکاف میان انتظارات ایجادشده و تجربه واقعی کاربران است. توسعهدهندگانی که با امید ارتقای عملکرد به نسخه جدید مهاجرت کردند، حالا با مدلی مواجه شدهاند که در انجام ابتداییترین وظایف نیز تأخیر قابل توجهی دارد؛ موضوعی که میتواند بر اعتماد به اکوسیستم هوش مصنوعی گوگل تأثیر بگذارد.