大学生对待AI作品态度的影响因素分析

研究方法
作者

yangjh

发布日期

2022年11月28日

import pandas as pd
import numpy as np
from scipy import stats
import plotly.express as px
import mytools
df1 = pd.read_excel(R"data\AI作品态度.xlsx")

解释性研究是关于现象或事物之间因果关系的研究。解释性研究是在描述性研究的基础上,进一步探寻“为什么”。解释性研究要在描述性研究的基础上对变量之间的关系进行分析,以确定它们之间是否存在相关,并进而判断它们之间是否存在因果关系。

在定量研究方法中,解释性研究通常是首先提出研究假设,然后从理论假设出发,设计出调查方案(收集资料的方案)并采用各种调查方法去收集经验材料,最后通过对资料的分析来验证假设,达到对社会现象进行理论解释的目的。

明确数据分析目标

本案例属于解释性研究。

研究假设:批判性思维能力越强,对待ai作品的态度越积极。 原假设:批判性思维能力与对待ai作品的态度无关。

数据获取

时间、渠道、数量、抽样方法

数据清理

### 空白值处理
temp = df1[df1.isnull().T.any()]
temp
序号 提交答卷时间 所用时间 来源 来源详情 来自IP 1、Al作品与人类作品您认为是否有区别? 2、请问以下哪个图是AI绘图形成: 3、以下哪张图是传统绘画作品 4、你是否喜欢绘画? ... 15、你认为事实和立场,哪个更重要? 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 22、对于新事物,我喜欢去尝试和体验 23、请问您是否觉得此问卷有不足的地方或建议 总分
0 1 2022/11/21 21:39:19 233秒 微信 NaN 117.191.176.254(新疆-伊犁) 有区别,人类作品能感受到创作情感。 图2 图1 从来不画画 ... 不知道,这个要看具体事情吧 62 79 39 38 50 66 80 414
1 2 2022/11/21 21:46:40 50秒 微信 NaN 14.134.101.116(宁夏-固原) 有区别,人类作品能感受到创作情感。 图2 图1 从来不画画 ... 事实 35 54 21 58 46 94 36 (空) 344
2 3 2022/11/21 21:47:12 45秒 微信 NaN 210.26.15.148(甘肃-兰州) 有区别,人类作品能感受到创作情感。 看不出来 图1 从来不画画 ... 不知道,这个要看具体事情吧 22 40 65 5 39 86 39 296
3 4 2022/11/21 21:47:34 90秒 微信 NaN 42.93.105.122(甘肃-定西) 有区别,人类作品能感受到创作情感。 看不出来 看不出来 从来不画画 ... 事实 33 64 48 63 45 52 79 384
4 5 2022/11/21 21:48:47 49秒 微信 NaN 42.88.207.8(甘肃-武威) 有区别,人类作品能感受到创作情感。 都不是 都是 从来不画画 ... 事实大于立场 83 50 50 41 28 68 66 (空) 386
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
118 119 2022/11/24 21:58:36 259秒 微信 NaN 61.178.223.212(甘肃-兰州) 有区别,人类作品能感受到创作情感。 都不是 图2 平时都不会画,除非有工作或学习上的要求 ... 事实和立场各占一半 57 14 13 52 89 65 89 379
119 120 2022/11/25 12:43:34 180秒 微信 NaN 39.161.242.37(江西-南昌) 有区别,人类作品能感受到创作情感。 图1 图2 还行,偶尔画画 ... 事实和立场各占一半 43 81 24 62 62 64 53 (空) 389
141 142 2022/11/25 20:19:40 179秒 微信 NaN 110.185.95.191(四川-成都) 有区别,人类作品能感受到创作情感。 看不出来 看不出来 从来不画画 ... 不知道,这个要看具体事情吧 34 100 77 100 77 56 54 (空) 498
144 145 2022/11/25 20:38:00 310秒 微信 NaN 112.4.255.167(江苏-镇江) 有区别,人类作品能感受到创作情感。 图1 都是 还行,偶尔画画 ... 不知道,这个要看具体事情吧 20 82 39 22 51 49 82 (空) 345
149 150 2022/11/28 22:03:35 111秒 微信 NaN 36.142.173.157(甘肃-临夏) 有区别,人类作品能感受到创作情感。 图2 图1 还行,偶尔画画 ... 事实大于立场 57 48 74 46 52 52 80 (空) 409

103 rows × 30 columns

### 删除空值列——来源详情
df2 = df1.drop(columns="来源详情")
"""再次查看空白列"""
temp = df2[df2.isnull().T.any()]
temp
序号 提交答卷时间 所用时间 来源 来自IP 1、Al作品与人类作品您认为是否有区别? 2、请问以下哪个图是AI绘图形成: 3、以下哪张图是传统绘画作品 4、你是否喜欢绘画? 5、你是否了解AI(创作)? ... 15、你认为事实和立场,哪个更重要? 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 22、对于新事物,我喜欢去尝试和体验 23、请问您是否觉得此问卷有不足的地方或建议 总分

0 rows × 29 columns

## 查看重复值
df2[df2.duplicated(subset=['来自IP'],keep='first')][['来自IP']]
来自IP
55 61.178.223.214(甘肃-兰州)
62 112.49.214.250(福建-福州)
95 61.178.223.214(甘肃-兰州)
# 删除重复值
df3 = df2.drop_duplicates(subset=['来自IP'],keep='first')
# 查看变量类型
df3.dtypes.to_frame()
0
序号 int64
提交答卷时间 object
所用时间 object
来源 object
来自IP object
1、Al作品与人类作品您认为是否有区别? object
2、请问以下哪个图是AI绘图形成: object
3、以下哪张图是传统绘画作品 object
4、你是否喜欢绘画? object
5、你是否了解AI(创作)? object
6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? object
7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) object
8、请问你认为借助AI创作出的作品可以被称为艺术品吗? object
9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? object
10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? object
11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? object
12、你认为AI的发展会对绘画行业造成多大影响 object
13、面对某一件事情,你更在乎过程还是结果? object
14、对某一件事情的看法,你认为你更多的是出于理性还是感性? object
15、你认为事实和立场,哪个更重要? object
16、AI绘画提供了更多创意,促进了艺术领域的繁荣 int64
17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 int64
18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 int64
19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 int64
20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 int64
21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 int64
22、对于新事物,我喜欢去尝试和体验 int64
23、请问您是否觉得此问卷有不足的地方或建议 object
总分 int64
填写问卷时长 object
### 必要的数据转换
df3['填写问卷时长'] = df3['所用时间'].str.rstrip('秒')
# 指定变量的类型
df4 = df3.astype({
    '提交答卷时间': 'datetime64[ns]',
    '所用时间': 'string',
    '填写问卷时长': 'int',
    '来源': 'string',
    '来自IP': 'string',
    '1、Al作品与人类作品您认为是否有区别?': 'category',
    '2、请问以下哪个图是AI绘图形成:': 'category',
    '3、以下哪张图是传统绘画作品': 'category',
    '4、你是否喜欢绘画?': 'category',
    '5、你是否了解AI(创作)?': 'category',
    '6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中?': 'category',
    '7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)': 'string',
    '8、请问你认为借助AI创作出的作品可以被称为艺术品吗?': 'category',
    '9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?': 'category',
    '10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗?': 'category',
    '11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看?': 'category',
    '12、你认为AI的发展会对绘画行业造成多大影响': 'category',
    '13、面对某一件事情,你更在乎过程还是结果?': 'category',
    '14、对某一件事情的看法,你认为你更多的是出于理性还是感性?': 'category',
    '15、你认为事实和立场,哪个更重要?': 'category',
})
df4.dtypes.to_frame()
0
序号 int64
提交答卷时间 datetime64[ns]
所用时间 string
来源 string
来自IP string
1、Al作品与人类作品您认为是否有区别? category
2、请问以下哪个图是AI绘图形成: category
3、以下哪张图是传统绘画作品 category
4、你是否喜欢绘画? category
5、你是否了解AI(创作)? category
6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? category
7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) string
8、请问你认为借助AI创作出的作品可以被称为艺术品吗? category
9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? category
10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? category
11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? category
12、你认为AI的发展会对绘画行业造成多大影响 category
13、面对某一件事情,你更在乎过程还是结果? category
14、对某一件事情的看法,你认为你更多的是出于理性还是感性? category
15、你认为事实和立场,哪个更重要? category
16、AI绘画提供了更多创意,促进了艺术领域的繁荣 int64
17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 int64
18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 int64
19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 int64
20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 int64
21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 int64
22、对于新事物,我喜欢去尝试和体验 int64
23、请问您是否觉得此问卷有不足的地方或建议 object
总分 int64
填写问卷时长 int32
## 异常值查找
df4['填写问卷时长'].describe()
count    147.000000
mean     187.632653
std      117.642253
min       31.000000
25%      111.500000
50%      176.000000
75%      227.000000
max      937.000000
Name: 填写问卷时长, dtype: float64
fig = px.histogram(df4, x="填写问卷时长")
fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
## 逻辑一致性检查
df5 = df4.drop(df4.query('(填写问卷时长 >600) or (填写问卷时长 <= 50)').index)
# 数据清理完毕

df = df5.copy()

数据分析

描述统计

先描述样本背景,对样本质量进行评价。再描述样本特征信息、样本基本现状,最后描述样本基本态度及其他维度。

描述统计分析也应该有理论依据或概念合理的分类。

important_factors = mytools.gen_mcq_df(df,'7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)')
important_factors = important_factors.sort_values(by='比例')
important_factors
次数 比例
AI绘画对传统绘画的冲击 54 39.705882
AI绘画推广过程中涉及的版权问题 57 41.911765
AI绘画工作的成本与效率 67 49.264706
AI绘画带来的商业价值 74 54.411765
受众对AI绘画的认可程度 94 69.117647
fig = px.bar(important_factors, x="比例",orientation='h')
fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json

推论统计

对研究假设逐一进行检验。

为检验研究假设,需要首先构造研究假设中的自变量(批判性思维能力)、因变量(对待AI作品的态度)

"""
生成自变量:批判性思维能力
批判性思维能力 = 22、对于新事物,我喜欢去尝试和体验 + 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法  
"""
df['批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']+df['21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法']
# df['批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']
df['批判性思维能力'].describe()
count    136.000000
mean     137.985294
std       33.043627
min       59.000000
25%      116.000000
50%      133.000000
75%      161.250000
max      200.000000
Name: 批判性思维能力, dtype: float64
fig = px.histogram(df, x="批判性思维能力")
fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
df['9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].cat.categories
Index(['其他', '其他〖ai作画挺欣赏的,但它是融合了其他画手的成果,感官复杂〗', '其他〖看不出来〗', '对于两者都喜欢,都可接受',
       '更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉', '更喜欢感受传统及现有艺术作品的魅力'],
      dtype='object')
"""
生成因变量:对待AI作品的态度(分值越高,态度越积极)
对待AI作品的态度 = 8、请问你认为借助AI创作出的作品可以被称为艺术品吗? + 9、    当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?
"""
def re_gen_attitude1(x):
    """
    依据变量的取值,重新生成变量
    """
    if x == "不可以,只是新兴技术在其他领域的具体体现":
        return -1
    elif x == "可以,是理性与感性的结合":
        return 1
    else:
        return 0
def re_gen_attitude2(x):
    """
    依据变量的取值,重新生成变量
    """
    if x == "更喜欢感受传统及现有艺术作品的魅力":
        return -1
    elif x == "更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉":
        return 1
    else:
        return 0
df['对待AI作品的态度'] = df['8、请问你认为借助AI创作出的作品可以被称为艺术品吗?'].apply(re_gen_attitude1) + df['9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].apply(re_gen_attitude2)
fig = px.histogram(df, x="对待AI作品的态度")
fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json

假设检验

可将自变量和因变量视为定距变量,采用R方描述相关性,采用F检验进行假设检验。

fig = px.scatter(df,  # 数据集
                 x="批判性思维能力",  # x轴
                 y="对待AI作品的态度"  # y轴
                )
fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json

x = '批判性思维能力'
y = '对待AI作品的态度'
r, p = stats.pearsonr(df[x], df[y])
info = f"积矩相关系数r为:{r:.3f},决定系数r平方为:{r*r:.3f},相关强度为{mytools.draw_on_r(r*r)}。"
print(info, p)
积矩相关系数r为:0.029,决定系数r平方为:0.001,相关强度为极弱相关或不相关。 0.7244083050325453

计算147名受试者的批判性思维能力和对待AI作品态度的得分,两个变量的Pearson相关系数\(r(147)=0.029,p=0.724\),接受原假设,研究假设不成立,即两者不存在相关性。