AI/Google&DeepMind

대화형 AI 안전의 교차성: 베이지안 다단계 모델이 안전에 대한 다양한 인식을 이해하는 데 도움이 되는 방법

유로파물고기 2023. 6. 21. 11:04
반응형

https://arxiv.org/abs/2306.11530

 

Intersectionality in Conversational AI Safety: How Bayesian Multilevel Models Help Understand Diverse Perceptions of Safety

Conversational AI systems exhibit a level of human-like behavior that promises to have profound impacts on many aspects of daily life -- how people access information, create content, and seek social support. Yet these models have also shown a propensity f

arxiv.org

1. 이 논문은 대화형 AI 시스템의 안전성에 대한 인식이 주관적으로 다르며, 이것이 왜 다른 사람들이 동일한 대화를 안전하게 또는 불안전하게 인식하는지에 영향을 미치는 인구통계적 요인에 초점을 맞춥니다.

2. 우리는 252명의 성별, 연령 그룹, 인종/민족 그룹, 지역으로 계층화된 인간 평가자를 대상으로 베이지안 다중 수준 모델링을 사용하여 평가자의 인구통계적 요인과 대화형 AI 시스템의 안전성에 대한 평가 간의 관계를 탐색합니다.

3. 인구통계학적 특성과 콘텐츠 특성, 그리고 피해의 정도가 대화형 AI 시스템의 안전성을 결정하는 데 중요한 역할을 하는 것을 발견했으며, 특히 인종/민족과 성별은 강한 교차 효과를 보였으며, 이는 남아시아와 동아시아 여성에게 특히 해당합니다.