近日,海南大学计算机科学与技术学院2020级本科生张丽莉等同学在李德顺副教授的指导下,以第一作者身份撰写的学术论文“Partiality and Misconception: Investigating Cultural Representativeness in Text-to-Image Models”被国际顶级会议ACM CHI Conference on Human Factors in Computing Systems (简称CHI) 接收。
文章聚焦文本到图像 (Text to Image, T2I) 模型生成的图像文化代表性,主要研究T2I模型生成的内容是否能够公平、准确地反映全球文化。文章结合智能和人工方法,从多个维度对DALL-E v2, Stable Diffusion 1.5和2.1等三种流行的T2I模型进行定量研究。该研究做出的主要贡献包括:(1) 首次引入文化集群和文化主题两大属性,为文化代表性的多模态偏差分析提供新的视角和跨学科方法。(2) 通过分析193,700张生成图像和37,600张真实图像,首次全面探索了T2I模型在文化代表性方面的表现,揭示其在分布、多样性、拼凑和保真度方面的偏差。 (3) 构建了Unique Cultural Objects from Global Clusters (UCOGC) 基准数据集,该数据集包含来自30个国家不同文化主题的真实图像,UCOGC还能够支持训练视觉模型以实现文化对象识别。研究指出,T2I模型因其创造潜力而受到广泛关注,但模型会从训练数据中继承偏见,从而导致文化误解。
据悉,ACM CHI 2024即将于2024年5月11日-16日在美国夏威夷州檀香山市召开。ACM CHI是人机交互领域的国际顶级旗舰学术会议,是中国计算机学会(CCF)推荐的人机交互与普适计算领域A类国际学术会议。
计算机学院研究生廖曦,本科生杨再佳、高白杭和王纯洁以及羊秋玲教授为论文合作作者,李德顺副教授为论文通讯作者。
图1研究内容架构
图2UCOGC数据集(部分)