import pandas as pd
import numpy as np
from scipy import stats
import plotly.express as px
import mytools
大学生对待AI作品态度的影响因素分析
研究方法
= pd.read_excel(R"data\AI作品态度.xlsx") df1
解释性研究是关于现象或事物之间因果关系的研究。解释性研究是在描述性研究的基础上,进一步探寻“为什么”。解释性研究要在描述性研究的基础上对变量之间的关系进行分析,以确定它们之间是否存在相关,并进而判断它们之间是否存在因果关系。
在定量研究方法中,解释性研究通常是首先提出研究假设,然后从理论假设出发,设计出调查方案(收集资料的方案)并采用各种调查方法去收集经验材料,最后通过对资料的分析来验证假设,达到对社会现象进行理论解释的目的。
明确数据分析目标
本案例属于解释性研究。
研究假设:批判性思维能力越强,对待ai作品的态度越积极。 原假设:批判性思维能力与对待ai作品的态度无关。
数据获取
时间、渠道、数量、抽样方法
数据清理
### 空白值处理
= df1[df1.isnull().T.any()]
temp temp
序号 | 提交答卷时间 | 所用时间 | 来源 | 来源详情 | 来自IP | 1、Al作品与人类作品您认为是否有区别? | 2、请问以下哪个图是AI绘图形成: | 3、以下哪张图是传统绘画作品 | 4、你是否喜欢绘画? | ... | 15、你认为事实和立场,哪个更重要? | 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | 22、对于新事物,我喜欢去尝试和体验 | 23、请问您是否觉得此问卷有不足的地方或建议 | 总分 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 2022/11/21 21:39:19 | 233秒 | 微信 | NaN | 117.191.176.254(新疆-伊犁) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 62 | 79 | 39 | 38 | 50 | 66 | 80 | 无 | 414 |
1 | 2 | 2022/11/21 21:46:40 | 50秒 | 微信 | NaN | 14.134.101.116(宁夏-固原) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 从来不画画 | ... | 事实 | 35 | 54 | 21 | 58 | 46 | 94 | 36 | (空) | 344 |
2 | 3 | 2022/11/21 21:47:12 | 45秒 | 微信 | NaN | 210.26.15.148(甘肃-兰州) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 图1 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 22 | 40 | 65 | 5 | 39 | 86 | 39 | 无 | 296 |
3 | 4 | 2022/11/21 21:47:34 | 90秒 | 微信 | NaN | 42.93.105.122(甘肃-定西) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 看不出来 | 从来不画画 | ... | 事实 | 33 | 64 | 48 | 63 | 45 | 52 | 79 | 无 | 384 |
4 | 5 | 2022/11/21 21:48:47 | 49秒 | 微信 | NaN | 42.88.207.8(甘肃-武威) | 有区别,人类作品能感受到创作情感。 | 都不是 | 都是 | 从来不画画 | ... | 事实大于立场 | 83 | 50 | 50 | 41 | 28 | 68 | 66 | (空) | 386 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
118 | 119 | 2022/11/24 21:58:36 | 259秒 | 微信 | NaN | 61.178.223.212(甘肃-兰州) | 有区别,人类作品能感受到创作情感。 | 都不是 | 图2 | 平时都不会画,除非有工作或学习上的要求 | ... | 事实和立场各占一半 | 57 | 14 | 13 | 52 | 89 | 65 | 89 | 无 | 379 |
119 | 120 | 2022/11/25 12:43:34 | 180秒 | 微信 | NaN | 39.161.242.37(江西-南昌) | 有区别,人类作品能感受到创作情感。 | 图1 | 图2 | 还行,偶尔画画 | ... | 事实和立场各占一半 | 43 | 81 | 24 | 62 | 62 | 64 | 53 | (空) | 389 |
141 | 142 | 2022/11/25 20:19:40 | 179秒 | 微信 | NaN | 110.185.95.191(四川-成都) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 看不出来 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 34 | 100 | 77 | 100 | 77 | 56 | 54 | (空) | 498 |
144 | 145 | 2022/11/25 20:38:00 | 310秒 | 微信 | NaN | 112.4.255.167(江苏-镇江) | 有区别,人类作品能感受到创作情感。 | 图1 | 都是 | 还行,偶尔画画 | ... | 不知道,这个要看具体事情吧 | 20 | 82 | 39 | 22 | 51 | 49 | 82 | (空) | 345 |
149 | 150 | 2022/11/28 22:03:35 | 111秒 | 微信 | NaN | 36.142.173.157(甘肃-临夏) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 还行,偶尔画画 | ... | 事实大于立场 | 57 | 48 | 74 | 46 | 52 | 52 | 80 | (空) | 409 |
103 rows × 30 columns
### 删除空值列——来源详情
= df1.drop(columns="来源详情")
df2 """再次查看空白列"""
= df2[df2.isnull().T.any()]
temp temp
序号 | 提交答卷时间 | 所用时间 | 来源 | 来自IP | 1、Al作品与人类作品您认为是否有区别? | 2、请问以下哪个图是AI绘图形成: | 3、以下哪张图是传统绘画作品 | 4、你是否喜欢绘画? | 5、你是否了解AI(创作)? | ... | 15、你认为事实和立场,哪个更重要? | 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | 22、对于新事物,我喜欢去尝试和体验 | 23、请问您是否觉得此问卷有不足的地方或建议 | 总分 |
---|
0 rows × 29 columns
## 查看重复值
=['来自IP'],keep='first')][['来自IP']] df2[df2.duplicated(subset
来自IP | |
---|---|
55 | 61.178.223.214(甘肃-兰州) |
62 | 112.49.214.250(福建-福州) |
95 | 61.178.223.214(甘肃-兰州) |
# 删除重复值
= df2.drop_duplicates(subset=['来自IP'],keep='first') df3
# 查看变量类型
df3.dtypes.to_frame()
0 | |
---|---|
序号 | int64 |
提交答卷时间 | object |
所用时间 | object |
来源 | object |
来自IP | object |
1、Al作品与人类作品您认为是否有区别? | object |
2、请问以下哪个图是AI绘图形成: | object |
3、以下哪张图是传统绘画作品 | object |
4、你是否喜欢绘画? | object |
5、你是否了解AI(创作)? | object |
6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? | object |
7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) | object |
8、请问你认为借助AI创作出的作品可以被称为艺术品吗? | object |
9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? | object |
10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? | object |
11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? | object |
12、你认为AI的发展会对绘画行业造成多大影响 | object |
13、面对某一件事情,你更在乎过程还是结果? | object |
14、对某一件事情的看法,你认为你更多的是出于理性还是感性? | object |
15、你认为事实和立场,哪个更重要? | object |
16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | int64 |
17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | int64 |
18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | int64 |
19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | int64 |
20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | int64 |
21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | int64 |
22、对于新事物,我喜欢去尝试和体验 | int64 |
23、请问您是否觉得此问卷有不足的地方或建议 | object |
总分 | int64 |
填写问卷时长 | object |
### 必要的数据转换
'填写问卷时长'] = df3['所用时间'].str.rstrip('秒') df3[
# 指定变量的类型
= df3.astype({
df4 '提交答卷时间': 'datetime64[ns]',
'所用时间': 'string',
'填写问卷时长': 'int',
'来源': 'string',
'来自IP': 'string',
'1、Al作品与人类作品您认为是否有区别?': 'category',
'2、请问以下哪个图是AI绘图形成:': 'category',
'3、以下哪张图是传统绘画作品': 'category',
'4、你是否喜欢绘画?': 'category',
'5、你是否了解AI(创作)?': 'category',
'6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中?': 'category',
'7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)': 'string',
'8、请问你认为借助AI创作出的作品可以被称为艺术品吗?': 'category',
'9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?': 'category',
'10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗?': 'category',
'11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看?': 'category',
'12、你认为AI的发展会对绘画行业造成多大影响': 'category',
'13、面对某一件事情,你更在乎过程还是结果?': 'category',
'14、对某一件事情的看法,你认为你更多的是出于理性还是感性?': 'category',
'15、你认为事实和立场,哪个更重要?': 'category',
}) df4.dtypes.to_frame()
0 | |
---|---|
序号 | int64 |
提交答卷时间 | datetime64[ns] |
所用时间 | string |
来源 | string |
来自IP | string |
1、Al作品与人类作品您认为是否有区别? | category |
2、请问以下哪个图是AI绘图形成: | category |
3、以下哪张图是传统绘画作品 | category |
4、你是否喜欢绘画? | category |
5、你是否了解AI(创作)? | category |
6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? | category |
7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) | string |
8、请问你认为借助AI创作出的作品可以被称为艺术品吗? | category |
9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? | category |
10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? | category |
11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? | category |
12、你认为AI的发展会对绘画行业造成多大影响 | category |
13、面对某一件事情,你更在乎过程还是结果? | category |
14、对某一件事情的看法,你认为你更多的是出于理性还是感性? | category |
15、你认为事实和立场,哪个更重要? | category |
16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | int64 |
17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | int64 |
18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | int64 |
19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | int64 |
20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | int64 |
21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | int64 |
22、对于新事物,我喜欢去尝试和体验 | int64 |
23、请问您是否觉得此问卷有不足的地方或建议 | object |
总分 | int64 |
填写问卷时长 | int32 |
## 异常值查找
'填写问卷时长'].describe() df4[
count 147.000000
mean 187.632653
std 117.642253
min 31.000000
25% 111.500000
50% 176.000000
75% 227.000000
max 937.000000
Name: 填写问卷时长, dtype: float64
= px.histogram(df4, x="填写问卷时长")
fig fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
## 逻辑一致性检查
= df4.drop(df4.query('(填写问卷时长 >600) or (填写问卷时长 <= 50)').index) df5
# 数据清理完毕
= df5.copy() df
数据分析
描述统计
先描述样本背景,对样本质量进行评价。再描述样本特征信息、样本基本现状,最后描述样本基本态度及其他维度。
描述统计分析也应该有理论依据或概念合理的分类。
= mytools.gen_mcq_df(df,'7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)')
important_factors = important_factors.sort_values(by='比例')
important_factors important_factors
次数 | 比例 | |
---|---|---|
AI绘画对传统绘画的冲击 | 54 | 39.705882 |
AI绘画推广过程中涉及的版权问题 | 57 | 41.911765 |
AI绘画工作的成本与效率 | 67 | 49.264706 |
AI绘画带来的商业价值 | 74 | 54.411765 |
受众对AI绘画的认可程度 | 94 | 69.117647 |
= px.bar(important_factors, x="比例",orientation='h')
fig fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
推论统计
对研究假设逐一进行检验。
为检验研究假设,需要首先构造研究假设中的自变量(批判性思维能力)、因变量(对待AI作品的态度)
"""
生成自变量:批判性思维能力
批判性思维能力 = 22、对于新事物,我喜欢去尝试和体验 + 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法
"""
'批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']+df['21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法']
df[# df['批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']
'批判性思维能力'].describe() df[
count 136.000000
mean 137.985294
std 33.043627
min 59.000000
25% 116.000000
50% 133.000000
75% 161.250000
max 200.000000
Name: 批判性思维能力, dtype: float64
= px.histogram(df, x="批判性思维能力")
fig fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
'9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].cat.categories df[
Index(['其他', '其他〖ai作画挺欣赏的,但它是融合了其他画手的成果,感官复杂〗', '其他〖看不出来〗', '对于两者都喜欢,都可接受',
'更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉', '更喜欢感受传统及现有艺术作品的魅力'],
dtype='object')
"""
生成因变量:对待AI作品的态度(分值越高,态度越积极)
对待AI作品的态度 = 8、请问你认为借助AI创作出的作品可以被称为艺术品吗? + 9、 当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?
"""
def re_gen_attitude1(x):
"""
依据变量的取值,重新生成变量
"""
if x == "不可以,只是新兴技术在其他领域的具体体现":
return -1
elif x == "可以,是理性与感性的结合":
return 1
else:
return 0
def re_gen_attitude2(x):
"""
依据变量的取值,重新生成变量
"""
if x == "更喜欢感受传统及现有艺术作品的魅力":
return -1
elif x == "更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉":
return 1
else:
return 0
'对待AI作品的态度'] = df['8、请问你认为借助AI创作出的作品可以被称为艺术品吗?'].apply(re_gen_attitude1) + df['9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].apply(re_gen_attitude2) df[
= px.histogram(df, x="对待AI作品的态度")
fig fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
假设检验
可将自变量和因变量视为定距变量,采用R方描述相关性,采用F检验进行假设检验。
= px.scatter(df, # 数据集
fig ="批判性思维能力", # x轴
x="对待AI作品的态度" # y轴
y
) fig.show()
Unable to display output for mime type(s): application/vnd.plotly.v1+json
= '批判性思维能力'
x = '对待AI作品的态度'
y = stats.pearsonr(df[x], df[y])
r, p = f"积矩相关系数r为:{r:.3f},决定系数r平方为:{r*r:.3f},相关强度为{mytools.draw_on_r(r*r)}。"
info print(info, p)
积矩相关系数r为:0.029,决定系数r平方为:0.001,相关强度为极弱相关或不相关。 0.7244083050325453
计算147名受试者的批判性思维能力和对待AI作品态度的得分,两个变量的Pearson相关系数\(r(147)=0.029,p=0.724\),接受原假设,研究假设不成立,即两者不存在相关性。