شرکت Anthropic ابزاری متنباز برای سنجش میزان سوگیری سیاسی چتباتها منتشر کرده است؛ ابزاری که با پرسشهای زوجی و متقارن، میزان بیطرفی مدلهای زبانی را اندازهگیری میکند. نتایج اولیه نشان میدهد Claude در بخشی از این معیارها عملکرد بهتری نسبت به برخی مدلهای OpenAI داشته، اما در مقایسه با Grok و Gemini اندکی ضعیفتر ظاهر شده است. Anthropic هدف این اقدام را افزایش شفافیت و ایجاد استانداردی مشترک برای ارزیابی سوگیری هوش مصنوعی اعلام کرده است.