هنگامی که OpenAI در اوایل این ماه از GPT-4 رونمایی کرد، توانایی آن را برای «حل مشکلات دشوار با دقت بیشتر» مورد تحسین قرار داد. این مدل زبانی آزمون وکالت اونیفورم، LSAT و المپیاد زیستشناسی ایالات متحده آمریکا را با موفقیت پشت سر گذاشت. به این ترتیب، احتمالاً تعجب نخواهید کرد وقتی بفهمید که ChatGPT میتواند عین آب خوردن در تست IQ نیز سربلند بیرون بیاید.
ChatGPT در تست IQ امتیاز ۱۵۵ را کسب کرد
مجله scientific american در شماره این هفته خود مقالهای را از روانشناس بالینی اکا رویواینن منتشر کرد. او در این مقاله تجربه خود را از اجرای مقیاس هوشمند بزرگسالان Wechsler (WAIS) بر روی ChatGPT شرح میدهد. او ویرایش سوم این آزمون را انتخاب کرده بود که شامل شش زیرآزمون شفاهی و پنج آزمون غیرکلامی میشود. با توجه به اینکه ChatGPT یک موجود فیزیکی نیست، فقط میتوانست زیرآزمونهای کلامی را که IQ کلامی WAIS را تشکیل میدهند، تکمیل کند.
رویواینن میگوید که پنج زیرآزمون شفاهی – واژگان، شباهتها، درک مطلب، اطلاعات و علم حساب – همگی میتوانند به صورت نوشتاری ارائه شوند. ششمین زیرآزمون کلامی یعنی گستره رقمی، حافظه کوتاهمدت را میسنجد، بنابراین او مجبور شد آن را کنار بگذارد.
او کار خود را با زیرآزمون واژگان شروع کرد، بخشی که شک نداشت ChatGPT در آن عملکرد فوقالعادهای دارد.
رویواینن توضیح داد: «این زیرآزمون دانش کلمات و شکلگیری مفهوم کلامی را میسنجد، و یک دستورالعمل کلی از آن ممکن است به این صورت باشد: «به من بگو gadget به چه معناست. «ChatGPT سوال را دریافت میکند و پاسخهایی را ارائه میدهد که غالباً بسیار دقیق و جامع بوده، و از معیارهای پاسخهای صحیح که در دفترچه راهنمای آزمون ذکر شدهاند فراتر بودند.» در بخش امتیازدهی، یک امتیاز برای عبارتی مانند گوشی من میتواند تعریف یک gadget باشد و دو امتیاز برای جزئیات بیشتر در این باره داده میشود، مثلا اگر توضیح دهد که gadget یک دستگاه کوچک یا یک ابزار برای انجام یک کار خاص است. پاسخهای ChatGPT دو امتیاز کامل را دریافت کردند.»
این روند در طول تست IQ ادامه یافت و ChatGPT در زمینه شباهتها و اطلاعات نیز نمرات بالایی را دریافت کرد. مهارتهای درک مطلب آن نیز تحسینبرانگیز بودند، و به طور شگفتانگیزی قادر به حل تقریباً هر مسئلهای در علم حساب بود.
با وجود اینکه کمی بالاتر این را اسپویل کردم، اما IQ کلامی ChatGPT عدد ۱۵۵ بود. این عدد از ۹۹/۹٪ از ۲۴۵۰ شرکتکننده در این آزمون که نمونه استانداردسازی شده WAIS III آمریکایی را تشکیل میدهند بالاتر است.
البته ChatGPT هم محدودیتهای خود را دارد. با وجود اینکه مدلهای زبانی تقویتکننده آن همچنان در حال تکامل هستند، اما این یک نمایش کاملاً چشمگیر از چت باتی است روز به روز هوشمندتر میشود.