在大型数据集中,快速解读复杂联系以及重要变量对预测建模产出的影响。
了解单个变量对模型整体提升度的影响。
侦测异常值和/或影响因子,让您可以在后续分析中判别、捕获和删除它们。
图形化的数据探索,包括条形图、柱状图、箱图、热力图、气泡图、地图和更多图形(使用SAS可视化分析探索)。
根据相关矩阵、散点图和热力图和箱图直接派生出新的模型。
得到预测输出或细分结果,可直接应用到其它建模或可视化任务中。得到的输出可以存储和传送给缺少建模能力的用户使用。
生成模型评分代码。如果某个模型包含从其它模型(如叶节点、聚类节点等)产生的输出,将自动连接起来生成评分代码。
过滤观测。
交互式去除异常值,模型自动重新拟合。
用户自定义的事件水平。
模型自动更新,包括如下建模技术:
聚类
k-均值聚类。
用于评估聚类成员关系的轮廓图。
输入变量的散点图,用于反映小数据集的聚类特征;以及反映大数据集的聚类特征交叠的热力图。
可以出处聚类群组变量,用于进一步分析。
详细的汇总统计(各聚类的均值、每个聚类的观测个数等等)。
生成按需聚类节点作为一个新的列。
分类树
基于C4.5算法(信息增益或信息增益比率)。
树的交互式生长或修剪。
设置树的深度、最大分支数、叶子大小、修剪的强度等等。
对变量进行分箱处理,可自行决定分箱个数。
可通过为树图或概览图来交互式地探索树的结构。
生成按需聚类节点作为一个新的列。
广义线性模型
支持各种统计分布,包括beta、normal、binary、exponential、gamma、geometric, Poisson, inverse Gaussian 和 negative binomial。
设置收敛和迭代条件。
支持偏移变量。
对变量进行频数和加权处理。
残差诊断。
汇总表包括模型汇总、迭代历史、拟合统计、第三类检验和参数估计。
针对预测变量的缺失值处理选项。
按需生成预测值和残差并作为新的列。
逻辑回归
使用logit和probit链接函数来对二值数据进行建模。
影响统计量。
变量选取。
支持偏移变量。
对变量进行频数和加权处理。
残差诊断。
汇总表包括模型维度、迭代历史、拟合统计、收敛状态、第三类检验、参数估计和相应剖面。
针对预测变量的缺失值处理选项。
按需生成预测标签和预测事件可能性并作为新的列。调整预测阈值,以标记某个观测是否为事件。
线性回归
影响统计量。
变量选取。
对变量进行频数和加权处理。
残差诊断。
汇总表包括方差分析、模型维度、拟合统计、模型方差分析、第三类检验和参数估计。
针对预测变量的缺失值处理选项。
按需生成预测值和残差并作为新的列。
分组处理
针对每个群组,构建模型、计算和处理结果,无需每次进行数据排序或建立索引。
在决策树或聚类分析中立即建立基于群组的模型(例如:分层建模)。
模型评估与比较
生成模型比较汇总信息,例如提升图、ROC图、一致性统计和误分类率等评价指标。
交互式地滑动调整预测阈值,用于自动化更新评估统计和误分类率指标。
针对不同分位数,交互式评估提升度。
模型评分
将模型导出为SAS数据步代码,从而与其它应用进行整合。如果某个模型包含从其它模型得出的输出,将自动连结评分代码。
高扩展性内存处理
内存分析引擎SAS LASR分析服务器 (the SAS® LASR™ Analytic Server) 提供了一个安全、可扩展的多用户环境。
只需一次将数据读入内存,就可以持续支持多用户的实时交互处理无需将数据写入磁盘,也无需在不同分析步骤中对数据重排。
支持单服务器模式(适用于小的部门团队),也支持分布式环境,从而支持多节点多线程的高性能处理。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-21 15:53:10
2022-11-21 11:08:13
2022-11-21 11:19:46
2022-11-22 17:25:57
2022-11-22 17:25:45
甄选10000+数字化产品 为您免费使用
申请试用
评论列表