实验报告册 课程:
市场调研与预测 姓名:
班级:
学号:
任课老师:
实验一SPSS对变量的编辑与操作 [实验目的] 1、了解SPSS for windows的基本特点与功能。
2、学习掌握SPSS对变量的编辑与操作。
[实验内容] 1、通过具体案例的示范操作了解SPSS的数据编辑功能,SPSS下表格的生成和编辑,图形的生成和编辑,SPSS与其他软件的联接,SPSS的统计功能。
2、SPSS对变量的编辑与操作:变量名的编制;
变量名与变量标签,变量的值与值标签;
变量的定义和修改;
变量的增加、转移、复制、删除和插入;
变量集合。
[实验项目] 根据课本273页表15-1进行spss的基本操作,生成一spss文件上传教师端,并进行以上实验内容的练习。
[实验步骤] 1、 变量名:是变量参与分析的唯一标志,定义变量结构时首先应给出每个变量的变量名。
2、 数据录入:变量定义完后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。在编辑区中,把与变量名相对应的数据输入到单元格。
3、 粘帖:选定个案序号或变量名|单击鼠标右键|选择“cut”命令|选定目标单元|单击鼠标右键|选择“paste”命令。或“Edit”|“cut”|“Edit”|“paste” 复制:选定个案序号或变量名|单击鼠标右键|选择“copy”命令|选定目标单元|单击鼠标右键|选择“paste”命令。或“Edit”|“copy”|“Edit”|“paste” 删除:将光标移动到当前数据源所在区域,单击鼠标右键,在弹出的菜单选项中选择“Clear”命令。或“Edit”|“clear” 插入:1、选定任意单元格|Edit|Insert variable 或Insert cases 2、选定变量名|单击鼠标右键,在显示的下拉菜单中选择“Insert variables ”命令。
3、选定个案序号|单击鼠标右键,在显示的下拉菜单中选择“Insert cases”命令。
[实验结果] [教师批阅] 实验二 SPSS的描述性统计与图表 [实验目的] 1、掌握频数的概念以及百分比、有效百分比、累计百分比的概念。
2、学习掌握SPSS的频数分析过程。
3、掌握SPSS的交叉列联表分析过程。
4、掌握SPSS、EXCEL的图表制作 [实验内容] 1、SPSS频数分析的运用。
SPSS的频数表分析及其适用范围;
SPSS的频数分析对话框介绍;
对频数分析结果的描述。
2、交叉联表分析的运用。SPSS的交叉列联表分析及其适用范围;
SPSS的交叉列联表分析对话框介绍;
对交叉列联表分析结果的描述。
3、SPSS的图表生成 [实验项目] 为研究影响老年人购买养老保险的因素,进行问卷调查。根据所获得的调查数据“保险市场调查.sav”,分析老年人购买商业养老保险的原因。(注意该案例是关于多选项分析)
[实验步骤] 频数计算与分析 交叉表的生成、计算与分析:
1、单击Analyze——Descriptive Statistic——Crosstabs,打开Crosstabs对话框,在左侧的源变量框中选择变量移入右侧的Row框中和Column框中。
2、打开Statistics对话框,进行表的输出的内容和形式的相关设置。完后,单击“Continue”。
3、打开Cell Display对话框,在该框中选择在交叉表中输出的统计量。完后,单击“Continue”。
4、打开Table Format对话框,决定各行的排列顺序。完后,单击“Continue”。
5、单击OK按钮。
[实验结果] Statistics 购买商业养老保险的原因1 购买商业养老保险的原因2 购买商业养老保险的原因3 N Valid 243 133 59 Missing 868 978 1052 Mode 1 2 4 Std. Deviation 1.569 1.727 1.782 Skewness 1.412 .820 -.169 Std. Error of Skewness .156 .210 .311 Percentiles 25 1.00 2.00 3.00 40 1.00 2.00 4.00 50 1.00 2.00 4.00 75 3.00 4.00 6.00 从表中可以看出原因一,众数为1,标准均值误差为1.569,偏度为1.412,偏度标准误差为0.156。
四位数分别为:25%分位数1、50%分位数1、75%分位数3 百分比分布形态:偏度为1.412>0,表示正偏,即向左偏,平缓。
从表中可以看出原因二,众数为2,标准均值误差为1.727,偏度为0.820,偏度标准误差为0.210。
四位数分别为:25%分位数2、50%分位数2、75%分位数4 百分比分布形态:偏度为0.820>0,表示正偏,即向左偏,平缓。
从表中可以看出原因三,众数为4,标准均值误差为1.782,偏度为-0.169,偏度标准误差为0.311。
四位数分别为:25%分位数3、50%分位数4、75%分位数6 百分比分布形态:偏度为-0.169<0,表示负偏,即向右偏,平缓。
交叉表 Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent 家庭人均月收入(元)
* 养老报费占当前收入的百分比 259 23.3% 852 76.7% 1111 100.0% [教师批阅] 实验三 SPSS的差异分析 [目的要求] 1、学习掌握卡方分析的概念及应用。
2、学习掌握均值分析及单因素方差分析的概念及应用。
[实验内容] 1、卡方分析的原理;
列联系数与列联表;
皮尔逊卡方值;
SPSS的卡方分析过程;
应用举例。
2、均值分析方法;
单因素方差分析的原理、过程与应用。
3、通过实际案例的SPSS分析,掌握以上方法的操作。
[实验项目] 项目一:利用“住房状况调查.sav”的调查数据,推断家庭人均房面积的平均值是否为20平方米。
项目二;
根据“住房状况调查.sav”调查数据,推断本市户口总体和外地户口总体的家庭人均住房面积的平均值是否有显著差异。
项目三:某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的数据“广告地区与销售额.sav”,希望对广告形式和地区是否对商品销售额产生影响进行分析。
项目四:若以上结论是不同的广告形式、不同的地区对某产品的销售额有显著影响。进一步希望研究,究竟哪种广告形式的作用较明显,哪种不明显。
[实验步骤] 1. 执行“Analyze”菜单“compare means”选项中的“One-Simple T test”命令,在对话框中选择“人均面积”,在“Test value”中输入“20”,点击“OK” 2. 执行“Analyze”菜单“compare means”选项中的“Independent Simple T test”命令,选择检验变量“人均面积”,和分组变量“户口变量” 3. 执行“Analyze”菜单“compare means”选项中的“One-way ANOVA”命令,在“Factor”输入“广告形式”,而在“Dependent List”中输入“地区”或“销售额”,点击“OK” 4. 执行“Analyze”菜单“compare means”选项中的“One-way ANOVA”命令,在“Factor”输入“广告形式”,而在“Dependent List”中输入“销售额”,再对其它选项进行设置,点击“OK” [实验结果] 项目一 单个样本统计量 N 均值 标准差 均值的标准误 人均面积 2993 22.0060 12.70106 .23216 单个样本检验 检验值 = 20 t df Sig.(双侧) 均值差值 差分的 95% 置信区间 下限 上限 人均面积 8.640 2992 .000 2.00596 1.5508 2.4612 结论:人均住房面积不是20平方米。
项目二 组统计量 户口状况 N 均值 标准差 均值的标准误 人均面积 本市户口 2825 21.7258 12.17539 .22907 外地户口 168 26.7165 18.96748 1.46337 独立样本检验 方差方程的 Levene 检验 均值方程的 t 检验 差分的 95% 置信区间 F Sig. t df Sig.(双侧) 均值差值 标准误差值 下限 上限 人均面积 假设方差相等 65.469 .000 -4.968 2991 .000 -4.99069 1.00466 -6.96057 -3.02080 假设方差不相等 -3.369 175.278 .001 -4.99069 1.48119 -7.91396 -2.06742 项目三 ANOVA 销售额 平方和 df 均方 F 显著性 组间 5866.083 3 1955.361 13.483 .000 组内 20303.222 140 145.023 总数 26169.306 143 ANOVA 地区 平方和 df 均方 F 显著性 组间 .000 3 .000 .000 1.000 组内 3876.000 140 27.686 总数 3876.000 143 结论;推翻原假设,即广告形式和地区对销售额有影响。
项目四 描述 销售额 N 均值 标准差 标准误 均值的 95% 置信区间 极小值 极大值 下限 上限 报纸 36 73.2222 9.73392 1.62232 69.9287 76.5157 54.00 94.00 广播 36 70.8889 12.96760 2.16127 66.5013 75.2765 33.00 100.00 宣传品 36 56.5556 11.61881 1.93647 52.6243 60.4868 33.00 86.00 体验 36 66.6111 13.49768 2.24961 62.0442 71.1781 37.00 87.00 总数 144 66.8194 13.52783 1.12732 64.5911 69.0478 33.00 100.00 ANOVA 销售额 平方和 df 均方 F 显著性 组间 5866.083 3 1955.361 13.483 .000 组内 20303.222 140 145.023 总数 26169.306 143 结论:有图表看出,报纸对销售额影响最大。
[教师批阅] 实验四:SPSS的相关分析与回归分析 [目的要求] 1、学习掌握相关分析的概念及应用。
2、学习掌握回归分析的概念及应用。
[实验内容] 1、相关分析的原理;
SPSS的相关分析过程;
应用举例。
2、回归分析的原理;
SPSS的回归分析过程;
应用举例。
3、通过实际案例的SPSS分析,掌握以上方法的操作。
[实验项目] 项目一:利用“住房状况调查.sav”的问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。
项目二:为研究高等院校人文社会科学研究中立项课题数受哪些因素的影响,收集某年31个省市自治区部分高校有关社科研究方面的数据“高校科研研究.sav”,并利用线性回归分析方法进行分析。
[实验步骤] 项目一:
1. 选择““Analyze”|“Correlate”|“Bivarite”命令,出现下面对话框。
2. 选择变量将其移动到“Variables”列表框。在“Correlation Coefficients”下选择“Pearson”(简单相关系数),默认已选。在“Test of Significance”下选择“Two-tailed”,并选中“Flag significant correlations”。
3. 单击“Option”按钮,出现对话框,在其中进行相关设置。完后,单击“Continue”。单击“OK”按钮。
项目二:
1、菜单:Analyze-Regression-Linear 2、 把自变量选入Independent,把因变量选入Dependent。
3、Method: 选择 Stepwise 。
4、单击“Statistics”按钮,在弹出的子对话框中进行如下选择。选完后,单击“Continue”。
5、单击“Option”按钮,在在弹出的子对话框中进行如下选择。选完后,单击“Continue”。
6、单击“OK”按钮。
[实验结果] 项目一:
Descriptive Statistics Mean Std. Deviation N 计划面积 1.0157E2 29.54992 832 家庭收入 1.7696E4 15298.80341 2993 Correlations 计划面积 家庭收入 计划面积 Pearson Correlation 1 .323** Sig. (2-tailed) .000 Sum of Squares and Cross-products 7.256E5 1.483E8 Covariance 873.198 1.785E5 N 832 832 家庭收入 Pearson Correlation .323** 1 Sig. (2-tailed) .000 Sum of Squares and Cross-products 1.483E8 7.003E11 Covariance 1.785E5 2.341E8 N 832 2993 **. Correlation is significant at the 0.01 level (2-tailed). 从表中可知,2个变量的Pearson相关系数为0.323,大于零,呈正相关,表示家庭收入与计划面积呈正相关关系。
项目二:
Descriptive Statistics Mean Std. Deviation N 课题总数 960.000 838.1887 31 投入人年数 2.144E3 1634.3769 31 投入高级职称的人年数 1.035E3 832.2668 31 投入科研事业费(百元)
5.563E4 67361.4640 31 专著数 486.161 524.7494 31 论文数 4.530E3 3323.7483 31 获奖数 133.806 140.5132 31 Correlations 课题总数 投入人年数 投入高级职称的人年数 投入科研事业费(百元)
专著数 论文数 获奖数 Pearson Correlation 课题总数 1.000 .959 .944 .862 .868 .887 .665 投入人年数 .959 1.000 .988 .856 .901 .952 .677 投入高级职称的人年数 .944 .988 1.000 .892 .942 .953 .667 投入科研事业费(百元)
.862 .856 .892 1.000 .930 .781 .482 专著数 .868 .901 .942 .930 1.000 .853 .502 论文数 .887 .952 .953 .781 .853 1.000 .742 获奖数 .665 .677 .667 .482 .502 .742 1.000 Sig. (1-tailed) 课题总数 . .000 .000 .000 .000 .000 .000 投入人年数 .000 . .000 .000 .000 .000 .000 投入高级职称的人年数 .000 .000 . .000 .000 .000 .000 投入科研事业费(百元)
.000 .000 .000 . .000 .000 .003 专著数 .000 .000 .000 .000 . .000 .002 论文数 .000 .000 .000 .000 .000 . .000 获奖数 .000 .000 .000 .003 .002 .000 . N 课题总数 31 31 31 31 31 31 31 投入人年数 31 31 31 31 31 31 31 投入高级职称的人年数 31 31 31 31 31 31 31 投入科研事业费(百元)
31 31 31 31 31 31 31 专著数 31 31 31 31 31 31 31 论文数 31 31 31 31 31 31 31 获奖数 31 31 31 31 31 31 31 相关系数表:上表显示各变量间的Pearson相关系数和显著性检验单尾概率p值及例数。例如课题总数与投入人年数的相关系数为0.959,单尾概率p值为0.000,例数为31。
Variables Entered/Removeda Model Variables Entered Variables Removed Method 1 投入人年数 . Stepwise (Criteria: Probability-of-F-to-enter <= .010, Probability-of-F-to-remove >= .110). a. Dependent Variable: 课题总数 引入/剔除变量表:上表显示的变量是变量的引入和剔除,并且显示出引入和剔除的标准。从表中可以看出,模型引入变量投入人年数,没有变量被踢除,所以模型1中有变量投入人年数。
Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) -94.524 72.442 -1.305 .202 投入人年数 .492 .027 .959 18.194 .000 a. Dependent Variable: 课题总数 回归系数:上表显示模型1的偏回归系数(B)、标准误差(StdError)、常熟(Constant)、标准化偏回归系数(Beta,消除了单位的影响)、回归系数检验的t统计量观测值和相应的概率p值(Sig)。据模型1 建立的多元线性回归方程:
体表面积=-94.524+0.492*X 方程中的常数项为-94.524,偏回归系数b为0.492,经t检验,b的概率p值为0.000,按给定的显著性水平0.10的情况下,有显著意义。
Excluded Variablesb Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance 1 投入高级职称的人年数 -.119a -.343 .734 -.065 .024 投入科研事业费(百元)
.152a 1.528 .138 .278 .267 专著数 .023a .182 .857 .034 .188 论文数 -.278a -1.666 .107 -.300 .094 获奖数 .030a .411 .684 .077 .542 a. Predictors in the Model: (Constant), 投入人年数 b. Dependent Variable: 课题总数 模型外的变量:上表显示的是回归方程外的各模型变量的有关统计量,即Beta值和g概率p值、偏相关系数(Partial Correlation)线性统计的容许值(Collinearity Statistics),可见模型1中方程外的各变量偏回归系数经重检,概率p值大于0.10,故不能引入方程。
Residuals Statisticsa Minimum Maximum Mean Std. Deviation N Predicted Value -57.642 3246.986 960.000 803.7213 31 Residual -4.6629E2 509.6787 .0000 237.8914 31 Std. Predicted Value -1.266 2.845 .000 1.000 31 Std. Residual -1.927 2.106 .000 .983 31 a. Dependent Variable: 课题总数 残差统计量:上表是回归模型的残差统计量,标准化残差(Std. Residual)的绝对值最大为1.297,没有超过默认值3;
如果超过3,则显示具体观察单位(Case number)的标准化残差,以发现奇异值。
[教师批阅] 中南财经政法大学武汉学院
本文来源:https://www.windowchina.cn/fanwendaquan/gongwenfanwen/22108.html