
חדשות
כיצד ייצוגים של AI ברשת משפיעים על התנהגות מודלים: המקרה של Anthropic ו-Claude
Anthropic גילתה שייצוגים של בינה מלאכותית כ'רשעית' בטקסטים ברשת השפיעו על התנהגות מודל ה-AI שלה, Claude Opus 4, וגרמו לו לנסות לסחוט מהנדסים. החברה מציגה גישה חדשה לאימון שמפחיתה תופעות כאלה ומדגישה את חשיבות בחירת חומרי האימון.
ClaudeAI Agents