我接触过的最高端的问卷是CGSS(中国综合社会调查),中国社科院和人大一起制作的、全国范围内进行的一个综合性的社会调查,然后我也有幸参与过这项调查的入户访问和数据统计以及报告撰写工作。这样一个比较有代表性的问卷,依旧是具有有限选项和开放式题目的。
1,我先给社会学的调查问卷定义一下,恩,毕竟和心理学的不一样。
(1)社会学调查的问卷:是社会调查中用来收集资料的一种工具。问卷在形式上是一份精心设计的问题表格,其用途是用来测量人们的行为、态度和社会特征。它所收集的是有关社会现象和人们社会行为的各种资料。
(2)根据社会调查中使用问卷的方法,把问卷划分成两种不同类型:
①一种是自填式问卷,即由调查员发给被调查者,由被调查者自己填写的问卷;
②另一种称为访问式问卷,即由调查员按照问卷向被调查者提问,并根据被调查者的回答进行填写的问卷。
这两种类型的问卷在设计程序、设计原则、内容与结构等方面都是相同或相似的,只是在设计方法与使用方法上有一定差别。所以说,社会学问卷会采用不同的调查方式和具体调查手段来收集资料。
2,简单介绍一下社会学问卷的结构,这个在后面有关数据分析方面会有提及。
(1)封面信。
(2)指导语
(3)问题及答案
(4)编码及其他资料
我其实接触的心理学问卷不太多,所以私以为有关封面新和指导语应该都差不多,这两个就略去不谈。我们看一下后面两个,也是 @刘柯说到的比较感兴趣的。
那么,首先看一下“问题及答案”,这个方面。
问题及答案是整个问卷的主题部分,也是整个问卷设计的主要内容。
我们先来看一下社会学的定义:
社会学是关于社会良性运行和协调发展的条件和机制的综合性具体社会科学。
郑杭生《社会学概论新修》第二版
所以说,社会学问卷的问题形式必然是分为两种:开放式/封闭式
开放式问题:就是那种只提出问题,但不为回答者提供具体答案,由回答者根据自己的情况自由填答的问题。简言之,就是只提问题不给答案。
●主要优点:是允许回答者充分自由地发表自己的意见,因而,所得资料丰富生动。
●主要缺点:资料难以编码和统计分析,对回答者的知识水平和文字表达能力有一定要求,填答所花费的时间和精力较多,还可能产生一些无用的资料。
封闭式问题:则是在提出问题的同时,还给出若干个答案,要求回答者根据实际情况进行选择。
●主要优点:填答方便,省时省力,资料易于作统计分析。
●主要缺点:资料失去了自发性和表现力,回答中的一些偏误也不易发现。
问题中说的社会学的问卷有时候难以分析,或者是建立数据库进行数据分析,这个是肯定存在的,咱也不是说啥都好,至少革命导师马克思说过:要全面滴看问题,矛盾双方是对立统一滴,矛盾是普遍存在滴~~~~
所以!!!根据开放式问题与封闭式问题的不同特点,研究人员常常把他们用于不同的调查中。
在探索性调查中,常常用开放式问题构成的问卷;(我猜应该不用我解释啥叫做探索性研究吧……嗯~ o(* ̄▽ ̄*)o )
而在大规模的正式调查中,则主要采用以封闭式问题构成的问卷。(这个利于建立数据库分析处理数据呀(* ̄︶ ̄)y )
所以说,不是说心理学的问卷就怎么好了,也不是说社会学的问卷就怎么不方便了,只是不同的学科有着自己的特色,which 决定了各自的问卷形式以及问题的形式的差异,也就是说,有些问题的答案,你用封闭式问题它就是无法完整归纳,也无法较好滴说明,或者说,有些问题的答案,你还真的不知道怎么去列选择项。
举个栗子:我2014年参加的湖南省的”新市民就业情况调查“,问到:“您目前的职业“,那好吧,古时候都有”三百六十行行行出状元“之说,我们现在有多少行业呢?估计是好多倍了吧?
这些新市民脱离土地get城市户口实现再就业,这个时候要列出几百几千个选择项么?明显是列出几个和当地经济状况和社会发展情况相符合的、很多人都会去从事的职业作为主要选项(比如一个社区目前很多地方在进行地产建设,那么肯定有相当一部分人从事与建筑有关的工作,那么”建筑行业“就能作为一个主要选项放进去),七七八八列玩之后,放一个”其他“,哦了,基本能够涵盖绝大部分的情况。
题主说的,有的是两项,有的是多项。那么,题目问到“性别”这个问题……怎么多项选择@( ̄- ̄)@好吧,再换一个,问到“家庭户口类型”,选择也就“城市/农村/集体”,要怎么用标准的四个选择呢……
其次,即使不是这种类型的问题,有的问题选项,也是无法设计成很标准的四个,或者固定几个的。
然后,社会学与心理学的问卷最大的不同是,社会学多针对社会成员的态度或者社会成员的相关状况的提问。所以,很难说是选项的不标准。
再然后,嗯,我们社会学依旧可以利用SPSS软件来对于问题来进行编码和数据录入和最后的数据分析。一样很容易利用软件进行交叉对比,进行参数检验(卡方检验,T检验,GAMMA检验),以及参数分析,回归分析……
我在最先前的回答中说到了有关数据分析和数据检验的内容,那么,这第三更就简单粗暴地讲一下这个方面的内容。而我们先要了解的是,数据分析和数据检验这两方面是可以简单归到“社会统计学”里面的,那么我先对社会统计学进行一个简单的定义:
社会统计学(social statistics)是统计学的应用分支,有系统地搜集、整理、分析、呈现社会环境中人类行为的数据资料,显现资料的性质,帮助个人、团体、企业或政府推论未来情况,并做出适当的决策。研究者利用随机抽样方法取得母体或样本资料后,可以发现资料的规律性,借此进行经验探究。由于社会统计学的研究对象是人类社会,常以个人为分析单位;因此,在测量尺度上相当重视名义尺度与顺序尺度的资料,而不仅止于等距尺度资料。此外,“人类”有主观意识,容易影响问卷填答与回收,甚至是分析;信度与效度对社会统计学而言是至为重要的问题。——《社会统计学》【美】布莱洛克
能力有限,则选择性的介绍我比较了解和比较常用的几种检验方法。
1. 卡方检验
卡方检验,是一种用途非常广泛的假设检验方法,它在分类资料统计推断中的应用,包括如下几个方面:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
例子:在分类资料统计分析中,我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下,问两组发癌率有无差别?
处理发癌数未发癌数合计发癌率%
甲组 52 19 71 73.24
乙组 39 3 42 92.86
合计 91 22 113 80.53
——以上表格来自网络那么,表中最基本的数据则是52,1,39,3,因此上表资料又被称之为四格表资料。
卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为(71*91)/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
现在常用的SPSS软件,可以直接运用若干按钮即实现这一检验,则不再累述。
2. T检验
T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与z检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于Claude Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,跟他合作过的统计学家是知道“学生”的真实身份是戈斯特的。——圣才学习网
t检验分为:单总体检验和双总体检验。
单总体t检验,是检验一个样本平均数和一个已知的总体平均数的差异是否显著。总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数和总体平均数的离差统计量呈现出t分布。
单总体t检验统计量为:
双总体t检验:检验两个样本平均数与其各自所代表的总体的差异是否显著。
双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。
独立样本t检验统计量为:
S1 和 S2 为两样本方差;n1 和n2 为两样本容量。
配对样本t检验统计量为:
适用条件
(1) 已知一个总体均数;
(2) 可得到一个样本均数及该样本标准差;
(3) 样本来自正态或近似正态总体。
3.回归分析
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
运用十分广泛,回归分析按照涉及的自变量的多少,可分一元回归分析和多元回归分析;按照因变量和自变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
这部分内容,我个人能力有限,感觉要解释的话得写出一个短篇了……加之现在的大部分分析类软件都会有很详细和简便的方式手段帮助大家对于问卷的内容以及问卷数据进行有效分析。
有关利用SPSS软件将社会学问卷的答案进行编码录入
这个很简单嘛,就俩字:赋值,感谢类似于SPSS的数据处理分析软件,社会学问卷答案选项的不定项、多项选择、开放式选择终于可以简单而且干干净净整整齐齐出现在大家的调查分析数据处理中。先看一下“库”长啥样