SAS可视化建模统计工具的特性

来源: 云巴巴 2019-10-28 16:38:29

探索性建模(可通过SAS可视化分析探索获得)

  • 在大型数据集中,快速解读复杂联系以及重要变量对预测建模产出的影响。

  • 了解单个变量对模型整体提升度的影响。

  • 侦测异常值和/或影响因子,让您可以在后续分析中判别、捕获和删除它们。

  • 图形化的数据探索,包括条形图、柱状图、箱图、热力图、气泡图、地图和更多图形(使用SAS可视化分析探索)。

  • 根据相关矩阵、散点图和热力图和箱图直接派生出新的模型。

  • 得到预测输出或细分结果,可直接应用到其它建模或可视化任务中。得到的输出可以存储和传送给缺少建模能力的用户使用。

  • 生成模型评分代码。如果某个模型包含从其它模型(如叶节点、聚类节点等)产生的输出,将自动连接起来生成评分代码。

交互式的描述性建模和预测建模技术

  • 过滤观测。

  • 交互式去除异常值,模型自动重新拟合。

  • 用户自定义的事件水平。

模型自动更新,包括如下建模技术:

  • 聚类

    • k-均值聚类。

    • 用于评估聚类成员关系的轮廓图。

    • 输入变量的散点图,用于反映小数据集的聚类特征;以及反映大数据集的聚类特征交叠的热力图。

    • 可以出处聚类群组变量,用于进一步分析。

    • 详细的汇总统计(各聚类的均值、每个聚类的观测个数等等)。

    • 生成按需聚类节点作为一个新的列。

  • 分类树

    • 基于C4.5算法(信息增益或信息增益比率)。

    • 树的交互式生长或修剪。

    • 设置树的深度、最大分支数、叶子大小、修剪的强度等等。

    • 对变量进行分箱处理,可自行决定分箱个数。

    • 可通过为树图或概览图来交互式地探索树的结构。

    • 生成按需聚类节点作为一个新的列。

  • 广义线性模型

    • 支持各种统计分布,包括beta、normal、binary、exponential、gamma、geometric, Poisson, inverse Gaussian 和 negative binomial。

    • 设置收敛和迭代条件。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型汇总、迭代历史、拟合统计、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 逻辑回归

    • 使用logit和probit链接函数来对二值数据进行建模。

    • 影响统计量。

    • 变量选取。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型维度、迭代历史、拟合统计、收敛状态、第三类检验、参数估计和相应剖面。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测标签和预测事件可能性并作为新的列。调整预测阈值,以标记某个观测是否为事件。

  • 线性回归

    • 影响统计量。

    • 变量选取。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括方差分析、模型维度、拟合统计、模型方差分析、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 分组处理

    • 针对每个群组,构建模型、计算和处理结果,无需每次进行数据排序或建立索引。

    • 在决策树或聚类分析中立即建立基于群组的模型(例如:分层建模)。

  • 模型评估与比较

    • 生成模型比较汇总信息,例如提升图、ROC图、一致性统计和误分类率等评价指标。

    • 交互式地滑动调整预测阈值,用于自动化更新评估统计和误分类率指标。

    • 针对不同分位数,交互式评估提升度。

  • 模型评分

    • 将模型导出为SAS数据步代码,从而与其它应用进行整合。如果某个模型包含从其它模型得出的输出,将自动连结评分代码。

高扩展性内存处理

  • 内存分析引擎SAS LASR分析服务器 (the SAS® LASR Analytic Server) 提供了一个安全、可扩展的多用户环境。

  • 只需一次将数据读入内存,就可以持续支持多用户的实时交互处理无需将数据写入磁盘,也无需在不同分析步骤中对数据重排。

  • 支持单服务器模式(适用于小的部门团队),也支持分布式环境,从而支持多节点多线程的高性能处理。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

要如何去避免盲目使用数据分析软件

要如何去避免盲目使用数据分析软件

由于办公网络数据分析的可视化的限制,统计汇总也将有可能计算网络数据分析的一个更好的描述。因此要了解的公式。 数据分析的初学者可以很快地发现一系列的网络度量,针对每个节点或者边的指标。局部指标,例如度,或者针对整个网络的指标;全局指标,连通度,密度或者模块

2022-11-21 15:53:10

Tableau宣布退出中国市场,中国用户该何去何从?

Tableau宣布退出中国市场,中国用户该何去何从?

对Tableau来说,只要数据不过时,未来的路就不会就此止步。

2022-03-31 19:53:33

基于用户行为分析建立用户偏好模型

基于用户行为分析建立用户偏好模型

本文,会介绍一些关于用户行为分析的相关介绍,对此感兴趣的小伙伴们,还不赶快往下看。 我们经常将个性化推荐的思想简单地抽象为:通过用户的行为推测出用户的兴趣,那我们其实就是要通过用户行为分析建立一个用户偏好(偏好即兴趣)模型,模型中包含各个用户的一个或更多

2022-11-21 11:08:13

基于文本的网页分析算法都有哪些

基于文本的网页分析算法都有哪些

本文,介绍一下基于文本的网页分析算法都有哪些。简单来说,基于网页内容的分析算法指的是利用网页内容(文本、数据等资源)特征进行的网页评价。 网页的内容从原来的以超文本为主,发展到后来动态页面(或称为Hidden Web)数据为主,后者的数据量约为直接可见页

2022-11-21 11:19:46

数据分析可以给我们带来哪些经济效益?

数据分析可以给我们带来哪些经济效益?

一项研究表明,采用数据驱动营销策略的公司可以增加20%的收入,降低30%的成本。大数据分析对于监视电子商务活动、广告活动和多渠道很有用。这使企业可以衡量它们的性能和有效性,从而更容易查看哪些有效,哪些无效。

2022-11-22 17:25:57

常用的数据分析方法都有哪些?

常用的数据分析方法都有哪些?

一、基于用户(了解用户基础信息和行为爱好) 用户基础信息/用户行为偏好 二、基于产品(分析产品使用行为和路径) 常用的分析工具:漏斗分析/事件分析/留存分析

2022-11-22 17:25:45

严选云产品

畅捷通易代账智能票据管理系统 畅捷通易代账智能票据管理系统,多渠道获取票据,获取全票面信息,智能分类,飞机票、火车票、汽车票自动计算抵扣额。批量一键取票,取票时无需插税控盘。手机小程序扫一扫、拍照,多种票据批量扫描。
深信服SDW-V安全融合一体机 深信服SDW-V安全融合一体机,通过NFV技术扩展丰富的安全组网组件,支持云网端联动,快速定位处置安全威胁,NFV组件支持SD-WAN智能选路,保障业务最优访问体验,支持接入统一管理平台,实现分支设备快速部署和集中运维。
原圈科技内容营销管理系统CMS 原圈科技内容营销管理系统CMS,AI 撩客、Call 客发现客户线索、确认客户意向,实时推送至一线顾问手机。内容形式全覆盖、创新内容形式层出不穷,全面支持 12+内容形态和 40+内容标签,轻松导入项目自产卖点。
腾讯问卷教育行业解决方案 腾讯问卷教育行业解决方案高效开展信息收集、报名、在线考试与测评工作,掌握学生需求与教育情况,提升教学质量与满意度,样本定向投放,精准了解目标对象教学需求。基于组织架构收集教职人员信息,实时掌握进度,催答未填。培训考试&阶段考核,全流程、轻量化的在线考试解决方案。
Oracle NetSuite批发分销行业ERP解决方案 Oracle NetSuite批发分销行业ERP解决方案通过云端技术实现库存管理、订单处理、财务报表和客户关系管理的集成,支持多地点、多渠道和多货币操作,优化供应链效率,提升业务灵活性和客户满意度。
随锐科技 工业智能巡检机器人 库锐德是随锐科技集团股份有限公司旗下工业智能巡检机器人产品,运用人工智能、大数据等技术为客户打造智能化解决方案,可应用于电力、能源、石油、通信、IT等行业。

甄选10000+数字化产品 为您免费使用

申请试用