




kok电子竞技权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
kok电子竞技:文档简介
Matlab数据分析第1章数据的基本概念及其应用第2章Matlab基础第3章随机模拟第4章数据预处理第5章数据探索与分析第6章多元线性回归模型第7章聚类分析第8章分类第5章数据探索与分析5.1数据的特征统计量5.1.1中心度量趋势:均值、中位数、众数5.1.2常用的变异程度度量1.极差2.方差3.标准差4.标准差系数5.四分位数间距5.1数据的特征统计量6.百分位数5.1.3分布形态5.2基本统计描述的可视化5.2.1分类型数据频数分布及其可视化例5.1表5-1是X公司员工收入基本状况调查表,用此表数据来说明对于分类型数据的频数统计及其数据可视化。5.2基本统计描述的可视化例5.2使用Matlab数据统计信息。(1)打开“数据统计信息对话框”“数据统计信息”对话框可帮助您计算和绘制数据的描述性统计量。5.2基本统计描述的可视化5.2基本统计描述的可视化5.2基本统计描述的可视化(2)设置绘图上数据统计量的格式“数据统计信息”对话框使用颜色和线型将统计量与绘图上的数据区分开来。1)在Matlab窗口中,单击工具栏中的(编辑绘图)按钮。2)双击要编辑其显示属性的绘图上的统计量,例如,双击表示Station2均值的水平线。(3)将统计量保存到Matlab工作区执行下列步骤可将统计量保存到Matlab工作区。5.2基本统计描述的可视化(4)查看新结构体变量可输入变量名称:5.2基本统计描述的可视化(5)生成代码文件示例的此部分显示如何从图形生成Matlab代码文件,再将代码应用至新数据以重新生成相同格式的绘图和统计量。5.2.2直方图1.histogram函数绘制直方图5.2基本统计描述的可视化例5.3创建直方图。1)生成10000个随机数并创建直方图。2)对分类为25个等距离散化的10000个随机数绘制直方图,如图5-13所示。5.2基本统计描述的可视化3)生1000个随机数并创建直方图。5.2基本统计描述的可视化2.确定基本概率分布1)生成5000个均值5、标准差力2的正态分布随机数。2)对于均值为5、标准差为2的正态分布,叠加一个概率密度函数图,如图5-17所示。5.2基本统计描述的可视化例5.4对分类数据进行绘图。1)工作区变量Location是一个字符向量单元数组,它包含患者就医的3个唯一医疗机构。2)工作区变量。3)绘制直方图。4)仅为健康状况评估为Fair或Poor的患者绘制医院位置直方图,如图5-19所示。5.2基本统计描述的可视化5)创建饼图。5.2基本统计描述的可视化6)创建帕累托图。5.2基本统计描述的可视化7)创建散点图。5.2.3分位数图和经验累计分布函数5.2基本统计描述的可视化5.2.4分位数-分位数图——q-q图5.2基本统计描述的可视化5.2基本统计描述的可视化5.2.5箱形图1)最小值。2)第一个四分位数(Q1)。3)中位数(Q2)。4)第三个四分位数(Q3)。5)最大值。例5.5对于下述这组数据:331033353450348034803490352035403550
36503730
3925,作出箱形图。1)画箱形图时,把第和第三四分位数作力箱体的边缘,Q1=3465,Q3=3600。2)在中位数(3505)位置与箱体内画一条垂线,因此中位数线就把数据平分为两部分。3)通过使用四分位数间距IQR=Q3-Q1,定好界限的位置。5.2基本统计描述的可视化4)图5-25中的虚线被称触须线(Whisker)。5)最后,每个异常值的位置用符号*表示在图5-25中,看到了一个异常值3925。箱形图的作用有以下几个。1)箱形图非常直观地反映了样本数据的分散程度以及总体分布的对称性和尾重。2)利用箱形图可以直观地识别样本数据中的异常值。3)可比较几组数据的形状。5.2基本统计描述的可视化5.2基本统计描述的可视化例5.6绘制均匀分布随机样本与指数分布随机样本的箱形图(见图5-26)。5.2基本统计描述的可视化例5.7绘制服从标准正态分布随机数箱形图(见图5-27)。5.2基本统计描述的可视化5.2.6散点图5.2基本统计描述的可视化5.2基本统计描述的可视化5.3度量数据的相似性和相异性5.3.1数据矩阵、相异性矩阵、相似性矩阵1)数据矩阵。2)相异性矩阵。3)相似性矩阵。5.3度量数据的相似性和相异性5.3.2数值属性的相似性:相关系数1.协方差5.3度量数据的相似性和相异性5.3度量数据的相似性和相异性5.3度量数据的相似性和相异性2.相关系数3.散点图矩阵5.3度量数据的相似性和相异性5.3度量数据的相似性和相异性5.3.3数值属性的相异性:距离1.欧几里得距离(EuclideanDistance)2.曼哈顿距离(ManhattanDistance)5.4数据降维——主成分分析1.基本思想5.4数据降维——主成分分析2.主成分分析的计算步骤第一步,对原始数据进行标准化处理,即z分数规范化。第二步,计算样本相关系数矩阵,即第三步,计算相关系数矩阵R的特征值(?1,?2,?,?p)和相应的特征向量?i=[?i1,?i2
,?,?ip](i=1,2,?,P)。5.4数据降维——主成分分析第四步,选择重要的主成分,并写出主成分表达式。第五步,计算主成分得分。3.PCA算法的Matlab实现5.4数据降维——主成分分析4.案例分析5.4数据降维——主成分分析5.4数据降维——主成分分析第一步,绘制箱形图。第二步,使用主成分分析首先要求原来特征相关性比较密切。有以下两种方式。5.4数据降维——主成分分析①制作散点图矩阵(见图5-38)。②计算相关系数。第三步,进行主成分分析,最好是先将观察数据标准化,再作主成分分析;或者作加权主成分分析。5.4数据降维——主成分分析第四步,选择主成分,有两种方式。5.4数据降维——主成分分析第五步,解释主成分。5.4数据降维——主成分分析5.4数据降维——主成分分析第六步,模型应用。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
kok电子竞技:最新文档
- 兼职合同范本2014
- 买商用房合同范例
- 业主维权合同范本
- 保险服务类合同范本
- 个人用电协议合同范本
- 合同范例资产重组协议
- 出国读研申请书
- 古建筑购买合同范本
- 学生休息申请书
- 合同范例售后
- 公路施工技术ppt课件(完整kok电子竞技)
- 通信原理英文kok电子竞技课件:Ch6 Passband Data Transmission
- GB∕T 41098-2021 起重机 安全 起重吊具
- 如何发挥好办公室协调、督导、服务职能
- 部队安全教育教案大全
- 方管、矩形管规格与理论重量参考表82835
- HY∕T 0289-2020 海水淡化浓盐水排放要求
- 班组长管理能力提升培训(PPT96张)课件
- 法兰蝶阀螺栓配用表
- 垃圾中转站施工方案及施工方法
- 内蒙古自治区小额贷款公司试点管理实施细则
评论
0/150
提交评论