ابزار جدید Anthropic برای سنجش بی‌طرفی AI

Wait 5 sec.

شرکت Anthropic ابزاری متن‌باز برای سنجش میزان سوگیری سیاسی چت‌بات‌ها منتشر کرده است؛ ابزاری که با پرسش‌های زوجی و متقارن، میزان بی‌طرفی مدل‌های زبانی را اندازه‌گیری می‌کند. نتایج اولیه نشان می‌دهد Claude در بخشی از این معیارها عملکرد بهتری نسبت به برخی مدل‌های OpenAI داشته، اما در مقایسه با Grok و Gemini اندکی ضعیف‌تر ظاهر شده است. Anthropic هدف این اقدام را افزایش شفافیت و ایجاد استانداردی مشترک برای ارزیابی سوگیری هوش مصنوعی اعلام کرده است.