
SAS 模型工厂 SAS® Factory Miner
-
- 共 0人点评 稳定性: 0 兼容性: 0 功能: 0 价格: 0 服务: 0
针对多个客户群快速方便地建立和训练成百上千的预测模型。然后为每个客户群自动挑选最佳模型。当建模师和统计师的工作效率更高时,他们就有更多的时间用来发掘隐藏在分散
- 标签:
- 厂商:赛仕软件(北京)有限公司
- 详情
- 资费
- 常见问题
- 点评
- 咨询
- 售后
产品益处
加快建模的速度
通过自动化耗时的模型开发过程,获得巨大的模型生产能力,包括数据准备、变量转换、预测变量和算法选择等等。SAS模型工厂具有易于使用的web用户界面,让您可以为每个客户群建立多个模型,并且自动化地识别最准确的模型。
自动化模型开发选择最佳客户细分策略,解决您的业务问题。通过一套预置的建模模板,让您可以快速开始自定义预测建模,来满足您的要求。自动生成报告和文档化功能,使得在您的整个企业内,针对模型设计和结果的最佳实践经验分享变得十分便利。
更快地尝试新的想法
在大型复杂的数据上应用机器学习和预测分析技术,快速获得结果。如果某个模型失败了,您可以快速使用不同的输入或想法来重新尝试。当变量发生变化或发现了新的变量时,您可以在不重建整个数据挖掘流程或挑战现有算法的情况下,测试这些变量。快速将模型投入运营
可通过点击按钮在不同的生产环境中部署冠军模型。SAS模型工厂自动生成完整的评分代码--包括所有必须的数据准备和转换步骤。而且,重训练模型也很容易,因为所有与模型开发和部署相关的内容都被集中管理起来。功能特色
数据访问和数据准备
访问注册在SAS元数据服务器中的数据源,包括SAS数据集、数据表和Hadoop文件。
交互式设定数据源的元数据,例如变量角色、水平和顺序,或者使用自动设定来在项目间共享变量设置。
定义数据分组,进行分层建模。
使用自动的数据特征刻画和交互式变量分布图形,评估数据问题。
使用下列技术过滤输入数据:
缩尾
标准差
修剪
稀有值
为了得到更好的模型,可对数据进行转换:
Log
Log 10
平方根
倒数
平方
指数
中心化
标准化
区间
分箱
分位数
优化分箱
主成分分析
使用统计和机器学习补缺方法来清洗数据:
均值
最小
最大
中位数
中列数
常数
计数
基于分布
定制有指导学习模板交互式地建立自定义模板,包括模型和后续处理步骤:
过滤
主成分
补缺
数据变换
有指导和无指导的变量选取
创建您自己的模型模板
编辑数据准备或模型的参数,并保存为自定义模板
跨项目和用户共享模型模板
自助服务式机器学习技术
使用以下技术建立模型:
贝叶斯网络
决策树
梯度推进
神经网络
随机森林
支持向量机
广义线性模型
线性回归
逻辑回归
交互式查看模型结果
冠军模型的识别使用下列选取规则为每个分组自动选取冠军模型:
K-S统计量
提升和累计提升
增益和累积增益
误分类率
捕获事件的百分比
平均捕获事件的百分比
均方误差
推翻系统选取的模型,人工选取冠军模型
在一个和多个分组中交互式比较和评估模型
识别模型异常查看报告中的模型性能异常
轻松识别性能差的模型并查看细节信息
修改每个模型模板的缺省设置
模型跟踪与报表生成汇总报表,包括模型结果、重要变量和模型设置。
生成PDF和RTF格式的报告并共享。
模型重训练在新的数据集上重新训练现有模型模板
对重训练的模型生成模型评估统计量
生成模型性能衰减报告
灵活的模型管理和部署为所有模型模板自动生成SAS评分代码。
注册模型到SAS模型管理器中,可进行集中化的模型部署和管理(需要SAS模型管理器)。
使用SAS评分加速器在数据库和Hadoop中部署模型(需要SAS评分加速器)。
可扩展的处理在SAS服务器上使用多线程的过程步训练模型,利用多核服务器的处理能力。
通过SAS网格管理器使用异步处理训练模型,进行负载均衡和调度(需要SAS网格管理器)。
在数据库一体机(Oracle, Teradata, Greenplum和SAP HANA)或Hadoop上使用SAS高性能数据挖掘,在内存中训练模型(需要SAS高性能数据挖掘)。