
IBM SPSS Statistics Premium—数据挖掘软件
软件简介集所有功能于一身的版本,专为有多种***分析需求的大型企业而设计IBMSPSSStatisticsPremiumEdition帮助数据分析人员、规划人员、预测人员、调查研究人员、程序评估人员及数据库营销人员等在分析过程的每个阶段轻松地完成任务。它完全集成了Statistics功能,以及用于整个企业内各种专门的分析任务的相关产品。该软件能够显著提高生产力,有助于特定项目和业务目标取得出色成果。软件功能IBMSPSSStatisticsPremiumEdition包括以下功能:线性模型提供各种回归和***统计程序,旨在适应描述复杂关系的数据的固有特征。非线性模型能够将较为复杂的模型应用于数据。地理空间分析支持用户对位置和时间数据进行集成、探索和建模。模拟功能帮助分析人员自动模拟许多可能的结果(输入不确定时),同时改进风险分析和决策制定。定制表使用户能够轻松理解其数据,并针对不同受众以不同风格快速汇总结果。数据准备简化了分析过程的数据准备阶段。数据有效性和缺失值检查提升了获得有显著统计意义结果的几率。分类数据和数字数据可用于预测结果并以图形方式显示关系。决策树可更方便***识组、发现各个组之间的关系和预测未来事件。预测功能帮助您更快地分析历史数据并预测趋势。结构方程式建模工具使您能够以更准确的方式构建结构方程式模型,比使用直观的拖放功能设计的标准多变量统计模型更准确。引导程序简化了对模型稳定性和可靠性的测试,使生成的结果更加准确可靠。***采样评估和测试通过将样本设计整合到调查分析中,生成从统计意义而言更为有效的推论。直接市场营销和产品决策工具可帮助市场营销人员更轻松地发现适合的客户,提升营销活动效果。***图表(High-endcharts)使用户可以在一系列平台和智能设备上方便地创建和共享吸引人的可视化效果,并与之进行交互。线性模型StatisticsPremium包含广义线性混合模型(GLMM),用于分层数据。该软件具有通用线性模型(GLM)和混合模型程序。它包含广义线性模型(GENLIN),包括广泛使用的统计模型,例如针对正态分布响应的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。GENLIN还通过其非常通用的模型公式提供众多实用的统计模型。广义估计方程(GEE)程序扩展了广义线性模型的能力,使它们能使用关联的纵向数据和聚类数据。非线性模型多项式逻辑回归(MLR)可预测具有两个以上类别的分类结果。二元逻辑回归可将数据分为两个组。非线性回归(NLR)和受限非线性回归(CNLR)可估算非线性模型的参数。概率分析使用响应比例的分对数(Logit)转换或概率单位变换来计算模拟值。模拟功能蒙特卡罗模拟方法可以帮助您在现有数据不充分的情况下,根据现有的数据和/或已知的参数创建模拟数据集。可对非数值型变量(如“男”和“女”)进行模拟,无需将其记录为数值变量。现有的预测模型和数据可用作模拟的起点,包括从AutomaticLinearModeling(ALM)和IBMSPSSModeler导出的模型。生成输入数据时,会自动确定并使用分类输入之间的关联。使用一组不同的随机值,反复计算结果,生成可能结果值的分布,使用户能够选择***优值。SPSSStatistics可被用于分析模拟结果,以直观的形式呈现结果以及为决策者推荐的行动。GeospatialAnalyticsStatisticsPremium中的地理空间分析技术可帮助揭示地理空间数据中隐藏的关系和趋势。空间-时间预测(STP)技术可使线性模型适应2D和3D空间内位置随时间推移进行的度量,支持用户预测这些领域的长期变化趋势。使用广义空间关联规则(GSAR)发现空间和非空间属性之间的关联,此规则使用历史数据(例如,事件发生位置、事件类型和事件发生时间)来描述发生的事件,例如***或***爆发。定制表包含推论性统计信息时,针对人口统计组、客户群、时间段或其他分类变量比较平均值或比例。该软件可创建汇***计信息(从针对分类变量的简单计数到离差测定),并按照使用的任何汇***计信息对类别进行排序。它包括三种主要的测试:***性卡方测试、列平均值比较(t测试)和列比例比较(z测试)。交互式的表构建器提供拖放功能来创建数据***表。它排除了特定类别,能显示缺少值的单元格,并将小计添加到表中。表可实时预览并在创建时进行修改。表可导出至MicrosoftWord、Excel、PowerPoint或HTML,以便在报表中使用。数据准备StatisticsPremium可识别***或无效的案例、变量和数据值。该软件允许您查看缺失数据的模式并汇总变量分布。OptimalBinning为那些为名义属性设计的算法找到***佳可能结果。自动数据准备(AutomatedDataPreparation,ADP)工具通过一个***的步骤即可检测和纠正质量错误,找到缺少值的原因。建议和可视化帮助您确定要使用的数据。数据有效性和缺失值检查StatisticsPremium可使用六种诊断报表从多个角度检查数据,然后估算汇***计信息并确定缺少值的原因。该软件可快速诊断因缺少数据而带来的严重问题。它使您能够用估算值替换缺失的值。它显示每种缺失值的类型以及每个个例的所有极值的快照。通过将缺失值替换为估算值以包含所有组(甚至包括响应力较低的组)来消除隐含的偏差。分类数据和数字数据该软件可通过感知图、双重图和三重图来发现底层的关系。它使用类似于传统回归、主成份组件和典范相关的程序来预测结果并显示关系-帮助您处理并理解名义数据(例如,薪资)和顺序数据(例如,教育程度)。StatisticsPremium使您能够以可视化方式解释数据集,并在大型的分数、计数、等级、排名或相似性表中了解行与列之间的关系。该软件可处理数字数据中的非标准残留数据或者预测变量(例如,客户或产品属性)与结果变量(例如,购买/不购买)之间的非线性关系。提供了多种适用于数字数据和归类数据的方法,包括RidgeRegression、Lasso、ElasticNet、变量选择和模型选择。决策树StatisticsPremium以可视化方式确定模型的流动方式,因此您可发现特定的子组和关系。该软件直接在IBMSPSSStatistics中创建分类树,因此,您可以使用结果直接在数据内对案例进行分段和分组。它包括四种确立的树形增长算法:CHAID-快速、统计型的多向树算法,用于快速有效地探索数据,并针对所期望的结果构建分段和概要信息。穷举式CHAID-CHAID的一种变体,用于检查每个预测项所有可能的分支。分类和回归树(C&RT)-完整的二叉树算法,可对数据进行分区,并生成准确的同构子集。QUEST-一种统计算法,可快速有效地选择不包含偏差的变量,并构建准确的二叉树。选择或分类/预测规则使用IBMSPSSStatistics语法、SQL语句或简单文本(通过语法)生成。预测StatisticsPremium确保***决策者可以理解和使用您提供的信息。它会自动确定***适合的ARIMA或指数平滑模型来分析您的历史数据。时间因果关系建模(TCM)技术可帮助揭示大量时间序列中隐藏的因果关系,并确定每一个目标序列的***佳预测变量。一次可对数以百计不同的时间序列进行建模,而不是每次只能对一个变量建模。模型集中保存至一个文件,以便在数据发生变化时可更新预测,而无需重新设置参数或者重新估算模型。可编写脚本以自动使用新数据来更新模型。结构方程式建模StatisticsPremium测试假设情况,并确认观测变量与潜变量之间的关系-获得比回归分析更深入的洞察。它使您能够构建更能切实反映复杂关系的模型,因为无论是观测变量(例如,来自调查的非实验性数据)还是潜变量(例如,满意度和忠诚度),都可用于预测任何其他数值变量。该软件的可视框架用于比较、确认并完善模型。多变量分析包含并扩展了标准方法-包括回归、因子分析、相关分析以及方差分析。该产品包含三种数据归因方法:回归、随机回归和贝叶斯算法(Bayesian)。引导程序StatisticsPremium通过对原始样本的替换项进行重新采样,对某个估算项的采样分布进行估算。它会估算填充参数(例如,平均值、中值、比例、比值比、相关系数、回归系数等)的标准误差和置信度区间。该软件使您可以创建数以千计的数据集备用版本,以便进行更准确的分析。***采样评估和测试StatisticsPremium提供处理复杂样本设计(例如,分层、分群或多阶段采样)所需的***规划工具和统计信息。由于它将样本设计整合到了调查分析中,因此可帮助您获得更理想的结果。用户可使用分析和预测算法(包括预测事件的时间),在复杂的样本设计中更准确地处理数字和分类结果。向导简化了计划创建、数据分析和结果说明过程。***和产品决策制定工具StatisticsPremium通过为相似或截然不同的客户或联系人创建集群,对这些人进行细分。该软件利用一些共有特征对客户或联系人建档,以提高市场营销产品和活动的针对性。它可设计倾向性分数,以确定购买可能性***高的人群。测试包性能与控制包性能不相上下。对营销活动的响应通过邮政编码来标识。将营销活动响应数据与集成,以跟踪商机线索和报告销售成果。***图表StatisticsPremium拥有数十个内置的可视化模版,帮助您就分析结果进行沟通。通过“拖放”方式创建图表,无需编程技能。可以定制样式表和图形模板,以便在整个企业范围内设置新的图形标准,或与您的品牌匹配。图形可部署在使用IBMSPSSCollaborationandDeploymentServices、IBMSPSSStatistics和IBMSPSSModeler的运营系统中。该软件支持各种数据源,包括以定界符分隔的IBMSPSSStatistics数据文件以及常见的数据库源(例如,DB2、SQLServer、Or***e和Sybase)。)