반응형
https://arxiv.org/abs/2306.11530
1. 이 논문은 대화형 AI 시스템의 안전성에 대한 인식이 주관적으로 다르며, 이것이 왜 다른 사람들이 동일한 대화를 안전하게 또는 불안전하게 인식하는지에 영향을 미치는 인구통계적 요인에 초점을 맞춥니다.
2. 우리는 252명의 성별, 연령 그룹, 인종/민족 그룹, 지역으로 계층화된 인간 평가자를 대상으로 베이지안 다중 수준 모델링을 사용하여 평가자의 인구통계적 요인과 대화형 AI 시스템의 안전성에 대한 평가 간의 관계를 탐색합니다.
3. 인구통계학적 특성과 콘텐츠 특성, 그리고 피해의 정도가 대화형 AI 시스템의 안전성을 결정하는 데 중요한 역할을 하는 것을 발견했으며, 특히 인종/민족과 성별은 강한 교차 효과를 보였으며, 이는 남아시아와 동아시아 여성에게 특히 해당합니다.
'AI > Google&DeepMind' 카테고리의 다른 글
Learning to Modulate pre-trained Models in RL (0) | 2023.06.27 |
---|---|
AudioPaLM: 말하고 들을 수 있는 대형 언어 모델 (0) | 2023.06.23 |
딥마인드 자가 개선 로봇 에이전트 RoboCat (0) | 2023.06.21 |
π2vec: Policy Representations with Successor Features (0) | 2023.06.19 |
Block-State Transformer (0) | 2023.06.19 |