شرکت OpenAI با انتشار یک بنچمارک جدید به نام GDPval، گام مهمی در ارزیابی تواناییهای هوش مصنوعی در دنیای واقعی برداشته است. نتایج اولیه این آزمون نشان میدهد که مدلهای پیشرفتهای مانند GPT-5 در طیف گستردهای از وظایف شغلی، عملکردی بسیار شبیه به انسان دارد.