RapidMiner Studio是一款优秀的整个分析团队的可视化工作流设计器,可以帮助用户进行机器学习、数据挖掘、文本挖掘、预测性分析和商业分析等功能,还拥有图形互动界面,有需要的小伙伴欢迎来好软下载体验。
软件宗旨在为用户提升整个分析团队的工作效率,从基础分析人士到专家,支持通过快速拖放可视化界面来创建预测模型,方便快捷,并且拥有丰富的机器学习算法和函数库,轻松构建任意复杂的模型,并且始终能够达到你的理想要求和最佳的模型效果,软件内置丰富类型预构建模板,方便大家进行使用,减少时间资源的浪费,对于数据的处理,可直接在数据库中运行数据准备和ETL过程。并且完全不需要进行复杂的SQL编写,轻轻松松就完成查询和数据的检索过程,简化工作流程,对于数据的探索和可视化评估分析,将带来只管的图表方式,各种常见的图形都有,可以随时随地了解数据中的详细模式、趋势和分布并进行探索和分析,从而得到更加深入的信息。在生产之前完整的了解模型的真实性能,有助于避免错误和风险的产生,软件常采用自动化流程,完整控制整个过程,可以使数据科学家提高工作效率,从快速的创意原型设计到设计任务关键型预测模型。
视觉流程设计
提高从分析师到专家的整个数据科学团队的生产力
在一个拖放可视化界面中加速并自动创建预测模型
1500+算法和函数的丰富库确保了任何用例的最佳模型
为常见用例预先构建的模板,包括客户流失、预测性维护、欺诈检测等等
“群体的智慧”在每一步都提供了积极主动的建议来帮助初学者
自动数据库内处理
在数据库中运行data prep和ETL,以使您的数据针对高级分析进行优化
查询和检索数据,而不需要编写复杂的SQL
利用高度可伸缩的数据库集群
支持MySQL、PostgreSQL和谷歌BigQuery
连接到任何数据源
处理您的所有数据,无论它位于何处
立即创建指向数据库、企业数据仓库、数据湖、云存储、业务应用程序和社交媒体的连接
很容易在任何时间重用连接,并很容易与任何需要访问的人共享它们
从RapidMiner市场扩展到新的资源
数据可视化与探索
评估数据的健康度、完整性和质量
通过散点图、直方图、线图、平行坐标、箱形图等了解模式、趋势和分布
快速找到并修复常见的数据质量问题,包括丢失的值和异常值
使用健壮的统计概述和超过30种交互式可视化探索数据
数据准备和混合
消除为预测建模准备数据的麻烦
RapidMiner Turbo Prep提供了一个完全交互式的点+点击数据准备体验
跨任意数量的数据源提取、联接、筛选和分组数据
创建可计划和共享的可重复的数据准备和ETL流程
视觉和自动机器学习
快速创建有影响力的机器学习模型,无需编写代码
RapidMiner Auto Model使用自动机器学习在5次点击中创建模型
从数百种监督和非监督的机器学习算法中选择
实现基本和高级的ML技术,包括回归、集群、时间序列、文本分析和深度学习
构建模型以对诸如成本之类的约束敏感,从而优化预期的业务影响
使用自动化和手动的特征工程来优化模型的准确性
1、连接到您的数据
为了有效地作为数据科学工具,RapidMiner Studio必须首先连接到您的数据。
如果数据位于计算机上的文件中,则RapidMiner Studio必须读取文件格式。
如果数据在数据库中,则RapidMiner Studio必须连接到该数据库,并且知道该数据库的语言(SQL / NoSQL)。
如果数据位于云中,则RapidMiner Studio必须连接到云服务并了解其API。
如果数据是从其他软件工具导入或导出到其他软件工具(例如Python或Tableau),则RapidMiner Studio必须了解该工具。
如果通过代理或自签名SSL证书进行连接,则RapidMiner Studio必须导航该障碍。
好消息是,RapidMiner Studio支持各种 文件格式,数据库,云服务和其他软件工具,无论是本机还是通过扩展。
2、接对象
RapidMiner Studio 9.3中引入了连接对象的概念。
您可以将旧连接转换为连接对象。
通过网络连接数据时,必须先创建连接对象。连接对象启用与数据库或云服务的连接。所有连接对象都存储在连接文件夹图标 Connections子文件夹中的存储库中 。
从现在开始,我们只需将它们称为连接,但要记住它们与存储库中的其他对象有相似之处。例如,在将输出连接到读取数据库运算符之前,您可以将数据库连接拖到“处理面板”中以进行 检索。
要创建连接,请右键单击 连接文件夹图标 Connections文件夹,然后选择“ 创建连接图标 创建连接”。将打开“ 创建连接”对话框,您可以配置连接。如果您要连接到SQL 数据库:
选择连接类型(数据库连接图标数据库),存储库(将存储连接的位置)和连接名称。
按创建连接图标 Create,打开Edit Connection对话框。
在Setup选项卡下,选择Database System并填写User,Password,Host,Port和(可选)数据库名称。
按测试连接图标 测试连接。一旦它工作,保存图标保存连接。连接将出现在连接文件夹图标 连接 您在步骤(1)中选择的存储库的子文件夹。
您可以通过双击存储库面板中的连接,或右键单击连接并选择“ 打开图标 打开”或“ 打开图标 编辑”来随时查看连接详细信息。
3、宏作为注入参数的来源
在RapidMiner Studio中,可以立即使用流程宏中的值来进行连接设置。编辑连接时,按注入参数图标 设置注入参数并选择应从宏获取值的参数。然后宏名称需要匹配参数键才能注入该值。参数键可以在参数旁边的信息中找到。
宏源的配置是可选的。如果不配置前缀,宏名称必须与参数键匹配。如果给出了配置的前缀,则宏名称必须与前缀匹配,后跟下划线(_),以参数键结尾。对于前缀myprefix,参数密钥用户需要宏名称
myprefix_user
设置注入时以及视图和编辑对话框本身将显示应该使用的宏。
将此用于宏以将其正确地注入连接。
4、注入参数:共享连接
可以共享连接对象。
假设一组用户可以访问同一个数据库,并且他们在RapidMiner Server上进行协作。他们可以共享数据库连接,而无需共享其用户名和密码吗?答案是肯定的!
解决方案是将连接构建为模板,其中预填充所有公共参数,并注入每个用户唯一的所有参数。注入参数的值不存储在连接对象中,而是在每次使用连接时从外部源检索。可能的外部源包括RapidMiner Server 上的宏和安全存储。
要在RapidMiner Server存储库中创建连接,或将连接复制到RapidMiner Server存储库,用户必须属于连接管理器组。请参阅共享和权限。
概括地说,假设数据库凭据将安全地存储在RapidMiner Server上,使用连接模板的整个过程可能如下进行。我们将使用admin的连接管理员角色调用该用户。
1)在RapidMiner Studio中,管理员在RapidMiner Server存储库中创建连接。虽然可以在本地存储库中创建连接,但该连接仅提供宏作为注入源。
2)在编辑连接时,管理员按下按钮注入参数图标 设置注入参数并选择其值将保留为空白的参数(例如用户和密码)。管理员还必须选择RapidMiner Server作为注入值的来源。
3)要设置注入值,用户必须连接到RapidMiner Server的Web界面。单击“ 编辑连接”对话框中 显示的链接
或直接连接到Web界面,然后导航到Repository > Connections,并按名称标识连接。警告说:此连接缺少值。用户单击该链接,填写他或她自己的用户名和密码,然后按下保存在RapidMiner服务器中的按钮,其中安全地保存凭据。每个用户需要重复步骤(3)。
5、占位符
占位符可以在任何配置参数的值内使用,以引用其他参数。可以连接占位符和自由文本。不支持嵌套占位符。
由于占位符的语法与宏相同,因此清除上下文非常重要:
宏的上下文是进程。
占位符的上下文是连接。
占位符可以从当前选项卡以及任何其他选项卡访问参数值。要查找要通过占位符在不同字段中引用的字段的键,请查看原始字段的信息工具提示。在全部关键是你在找什么:
要在另一个字段中使用此占位符,只需在其他字段中引用完整键,方法是用百分号(%)和大括号({})括起来,如下所示:
%{db_config.database}
如果占位符无法解析,则只需将其替换为空字符串,但仍将其视为注入值,并且不会使流程执行失败。
基于JDBC的数据库连接使用此机制从参数创建URL。
如果没有参数信息,则URL由多个占位符和双冒号组成。通过设置参数,可以替换这些值。
使用与此完全相同的占位符系统来配置动态参数值。
显示全部