smartmining吧-百度贴吧

在众多的分类模型中，应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型（Naive Bayesian Model，NBC）。朴素贝叶斯模型发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率。同时，NBC模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。理论上，NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此，这是因为NBC模型假设属性之间相互独立，这个假设在实际应用中往往是不成立的

比机 1-23

0

新手兼吐槽，怎么把两个节点相连

侔繁求和抢 2019-12

纯新手，第一次使用SmartMining，遇到的第一个问题是文件导入，还好自己反复琢磨搞定。结果瞬间遇到第二个问题，两个节点之间的连线如何操作？遍寻软件界面和各大网站，都没有找到有用的信息其实软件很好，像我这种数据小白对SM的全新操作模式非常好奇，强烈要求开发者出一个简单操作版的指导贴——其实就是傻瓜版，方便入门也便于软件推广啊~~~~不然谁来玩？？？否则完全搞不懂操作，白浪了这么好的软件！

侔繁求和抢 12-1

3

数据的存储类型的含义区别：连续标志名义有序分类

h2o_h2o2

2017-02

伙伴们，SmartMining的数据存储类型的：连续标志名义有序分类具体指代什么

用剑不用刀 12-26

3

SmartMining示例教程的使用说明

orange121618 2017-01

SmartMining自带的帮助，从分类预测到关联分析、甚至文本挖掘案例包含了数据、操作方法每个模型的说明，每个建模方法的使用

王零曼曼 7-14

1

#一天一贴#第10贴 SmartMining与数据库

三星6699

2017-02

目前常用的数据库管理系统有： ACCESS、SQL Server、 Oracle、MySQL、FoxPro、Kylin和Sybase等。作为国内顶级的数据挖掘产品，SmartMining可以读取各类型的数据桌面版可以直接读取数据库数据，以进行数据挖掘，软件与数据库的便捷互动为数据的处理存储提供了便利，通过服务器版能对数据的使用权限和用户权限进一步管理，保证了数据的安全性。单独讲数据库的话数据库一般分为三种，即层次式数据库、网络式数据库和关系式数据库三种，而不同的数据库

hahahoho10 6-23

1

期待SmartMining更多新功能

黄小厨1010 2017-06

要大数据，要云计算，潮流不重要，能带来实际价值才行 smartmining懂大数据的价值在哪里

青青果果23 6-23

0

这个数据挖掘工具给我点新惊喜

13081935614_ 2017-06

但愿不是自己少见多怪，原来smartmining可以同时运行多个工作空间，一个项目一个工作空间并行，不干扰，太棒了

13081935614_ 6-23

6

SmartMining 界面说明

13081935614_ 2016-12

今天分享点什么呢 SmartMining作为大数据挖掘软件，有一股势不可挡的力量，但是作为一款专业的数据挖掘软件，还是很容易让人望而生畏，其实，真的想说，这款产品太容易使用了今天就来看看她的界面有多简单就知道了五个功能区域，分别为：菜单栏，节点库和浏览区，工作流操作区，大纲，消息区菜单栏：包含软件的配置菜单和多种操作按钮（工作按钮既可以单击使用，也可以通过鼠标右键单击获取相应功能）节点库：每一个节点就是一个封

共 4 张

黄小厨1010 6-23

0

数据挖掘，透过图看到数据的本质

用剑不用刀

2017-05

数据挖掘过程经常涉及到各种类型数据的表现的分析。当然首先需要看数据的缺失和值的分布情况，而最直观的方式，莫过于透过图来看数据，值的分析，字符型、布尔型取值分布、对比，数值数据的发展趋势。通过SmartMining的可视化探索，能够轻松获取更多信息，可以通过哪些图形进行数据的探索：直方图，条形图、线图、地图、词云，各种交互视图。

用剑不用刀 5-10

0

常用的算法有哪些，是怎么分类的

三星6699

2017-05

三星6699 5-10

1

紧急求助紧急求助啊啊啊

黑发小懒猫 2017-04

如图，主成分分析结果里面有PCA0 PCA1什么的这是什么意思啊？

三星6699 4-14

4

为什么类型转换总是有感叹号！

黑发小懒猫 2017-03

[2017年03月28日 11:23:15][警告] ColConvertSelfNodeModel 在3单元的值无法分析，第一个错误: '微博' (RowKey: Row0, 位置: 1) 就算用自带的类型转换也是错误，求大神告知为什么

黑发小懒猫 4-11

3

#一天一贴# 结合数据可视化技术如何能做出好看图表

三星6699

2017-03

1.充分学习数据，对原始数据的内容和格式充分的了解。 2.业务学习，从业务角度出发，确定适合的可视化手段。 3.找到业务与数据之间的关联，业务信息对应是分类字段，还是连续字段，亦或是主要强调的是趋势信息或者对比信息。不同的图形展现的信息侧重点不同，找准图形。 4.不同的图形对数据表的格式要求亦不相同，一般来讲，默认的数据很少能完美的契合图形对数据的要求。此时，数据的准备就很重要了。 5.数据可视化的信息是否足够丰富

h2o_h2o2 3-18

2

用数据讲话

清风_小熊 2016-11

很多人都说做数据挖掘，要会从数据中学习，养成数据思维，可是谁能告诉我要怎么做才行

h2o_h2o2 3-17

4

求教，SmartMining合并节点

帅磊磊free 2016-11

几种合并的区别在哪，求解答

h2o_h2o2 3-17

2

什么是数据挖掘中的关联分析

orange121618 2017-02

什么是数据挖掘中的关联分析，求解答

h2o_h2o2 3-17

1

数据挖掘到底难不难

黄小厨1010 2017-01

一个字，难而且是很难，难在分析思路，难在需要找到契合的数据挖掘工具，难在算法的学习和应用，学习成本高原谅我的吐槽

orange121618 3-17

1

#一天一贴#第四贴

三星6699

2017-02

今天必须要分享一点，有些人会想能不能数据造假，使得结果漂亮一些。做数据，底线就是尊重数据的真实性。数据挖掘总能给人惊喜的一点是，总能给您一些意想不到的结果，意料之外收获才是数据挖掘最大的价值吧。

orange121618 3-17

1

SmartMining云版是否可以独立使用

用剑不用刀

2017-03

服务器版的部分功能需要结合桌面版才可以。但是云版结合了桌面版和服务器版的功能，计算能力更强

orange121618 3-17

1

#一天一贴#如何养成数据挖掘思路

三星6699

2017-03

多多实践，找数据联系能参加比赛就参加比赛能参加项目就参加项目让自己多与数据挖掘接触自然而然的形成一套数据挖掘思维

hahahoho10 3-17

2

大数据挖掘与SmartMining敏捷挖掘最搭配

用剑不用刀

2017-01

很多企业和个人想了解大数据挖掘工具有哪些，于是乎，各种平台搜索，查找，找到回来发现没有满足最开始的需求。有些人可以推荐百十余种工具，但是对我们而言一个产品就可以了，很多开源小工具学习探路都不足够，不用说企业级应用和科学研究了。易用性和学习成本对比来讲，选择敏捷挖掘产品都是最合算的，可以免费试用，而且操作方式简单，双击或者拖拽加载算法，不需要码代码，也可以使用各种高级算法。大数据挖掘关键就在于对数

三星6699 3-17

2

#一天一贴# 数据挖掘常用术语分享

三星6699

2017-03

三星6699 3-17

4

你看过《失控》吗

用剑不用刀

2017-01

张小龙说，如果求职者说自己看完了凯文·凯利的《失控》，面试就可以愉快地结束了，我一定会录用ta。如果做互联网产品的不看一下这本书，我认为知识是不全面的。失控这本书，十个和你推荐它的人，七个自己没看完，至多一个读完，还有两个可能只是买回来发一下朋友圈。买完这本书就后悔了，因为你真的想把它读完，个人建议，如果阅读能力允许，买英文原版的来读，收益更大。《失控》二十四章主题甚至有人说“要是都看得懂，那还不

hahahoho10 3-16

2

为什么选择SmartMining

用剑不用刀

2016-09

对数据挖掘的喜爱源自于对于发现未知的兴奋，偶然的机会尝试使用SmartMining数据挖掘软件，用它做数据分析，只要想的到的需求一般都可以满足，简单拖拽，连接就能完成数据分析，不需要检查代码，不需要担心数据安全。使用SmartMining做了几个数据分析尝试后，就不放下这款好用的软件了。真希望更多人能够发现她

hahahoho10 3-16

1

SmartMining拥有丰富内在（百余种数据算法满足各种数据发觉需

13081935614_ 2016-12

作为强大的数据挖掘软件，SmartMining敏捷挖掘产品桌面版，能够通过桌面安装使用，使得人人都能轻松体验数据挖掘。想了解SmartMining操作界面，可以查看我上一篇的帖子根据算法功能将算法分为以下几个部分： * 数据源模块用来读取不同文件格式的数据。提供了各种数据源的读取接口，通过简单的配置连接更多数据库、数据文本文件。 *数据准备模块通过数据准备模块实现对数据的清洗整理工作。此模块包含丰富数据处理节点（算法）。根据处理

hahahoho10 3-16

3

SmartMining桌面版怎么切换主题

orange121618 2017-02

哪位大神知道，求解啊

h2o_h2o2 3-16

1

动态图轻松解析几何原理-搬运工一枚

h2o_h2o2

2017-02

1.椭圆的画法 2.杨辉三角问题（杨辉三角是二项式系数在三角形中的一种几何排列。也叫做帕斯卡三角形） 3.使用“FOIL”轻松的解决二项式乘法 4.矩阵转置的技巧 5.勾股定理(直角三角形两直角边（即“勾”，“股”）边长平方和等于斜边（即“弦”）边长的平方) 6.多边形的外角之和总是等于360度（虽然移动，但是角度） 7.圆周率π(圆的周长与直径的比值) 8.在Y轴上使用正弦(红色)，在X轴上使用余弦(蓝色)，则在XY轴平面上画出的环形(黑色) 9.同前一原

共 22 张

h2o_h2o2 3-16

1

#一天一贴# 聚类算法中的K-Means算法

三星6699

2017-03

K-Means算法是一个聚类算法，把N的对象根据他们的属性分为k个分割（k<N），K-聚类算法从一个目标集中创建多个组，每个组的成员都是比较相似的。基本步骤：（1）从 n个数据对象任意选择 k 个对象作为初始聚类中心；（2）根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离，并根据最小距离重新对相应对象进行划分；（3）重新计算每个（有变化）聚类的均值（中心对象）；（4）计算标准测度函数，当满足一定条件，

h2o_h2o2 3-16

1

使用SmartMining进行关联分析

用剑不用刀

2017-03

SmartMining将apriori算法封装，能够实现轻松的关联分析。购物篮分析作为关联分析的经典应用，使得很多人能够了解关联分析的应用。但是也有很多人认为关联分析只能做购物篮分析就不对啦关联分析的关键在于找到事务项之间是否存在内在联系，以及关系的特征

orange121618 3-16

1

#一天一贴# 算法应该灵活灵用

三星6699

2017-03

很多人在开始学习数据挖掘算法时，会进入一个误区，将学习的案例当作算法本身，不能跳出，案例只是算法应用的一个小的方面。算法是一种方法或者说一个工具，如何应用需要头脑灵活。。。当然不够了解算法的核心，对算法有通透的掌握，对数据有清洗的把握，这时候可以做到将算法和应用灵活结合

orange121618 3-16

0

#一天一贴#数据挖掘算法的神经网络

三星6699

2017-03

神经网络算法（Neural Network），神经网络是模拟人类大脑处理信息方式的简化模型。作为分类预测的算法之一，神经网络属于监督学习。分析此模型通过模拟大量类似于神经元的抽象形式的互连处理单元而运行。这些处理单元都位于层中。通常在神经网络中有三个部分：一个输入层，其中的单元表示输入字段；一个或多个隐藏层；一个输出层，带有一个或多个表示目标字段的单元。这些单元通过可变的连接强度（或权重）连接。输入数据显示在第一

三星6699 3-11

1

#一天一贴# 分享分布式分析引擎Kylin

三星6699

2017-03

国产Kylin有人将之成为大数据分析界的“神兽”。在现在的大数据时代，越来越多的企业开始使用Hadoop管理数据，但是现有的很多业务分析工具往往存在很大的局限，如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持；而利用Hadoop做数据分析依然存在诸多障碍，例如大多数分析师只习惯使用SQL，Hadoop难以实现快速交互式查询等等。神兽Apache Kylin就是为了解决这些问题而设计的。 Apache Kylin是一个开源的分布式分析引擎，为Hadoop等大型分布式

hahahoho10 3-9

0

#一天一贴# 什么是Hadoop

三星6699

2017-03

Hadoop是一个开发和运行处理大规模数据的软件平台。一，Hadoop是一个开源的框架；二，Hadoop能够进行大规模数据集地分布式处理；三，Hadoop能够用计算机集群存储海量数据；四，Hadoop可以从单一服务器扩展到成千上万的服务器，这些服务都能够提供本地化的存储和计算；五，Hadoop具有能够检测和处理应用层错误的能力；六，Hadoop包括Hadoop common/HDFS/Hadoop YARN/Hadoop MapReduce四个模块，每个模块负责各自的事务。 Hadoop得以在大数据处理应用中广泛应用得

三星6699 3-7

0

#一天一贴# 通过数据挖掘地图能获取哪些信息

三星6699

2017-03

地图作为数据挖掘可视化的重要手段应用的越来越广泛也又不少人理不清地图究竟能展示哪些信息地图上主要看的是：区域的含义，点的含义，线的含义，颜色的含义区域：一个区域代表了一个地理位置，包含了位置信息和区域的面积信息点：同样点可以代表一个地理位置，点的大小则包含了数量信息，另外，点的形状是一个分类线：第一个线，区域的边界，第二个线，位置间的关联，第三个带有方向的线，包含了流动信息，第四个线，流动的不

三星6699 3-2

0

#一天一贴# 还是说说模型准确性，SmartMining的模型准确性评估

三星6699

2017-03

从商业应用上看模型的准确定，就需要从数据和应用实际出发。尤其对于预测类的模型，数据的分布要有清晰的掌握。列明几点： 1.在商业应用中，不可能获取到全部因素，同时还有随机因素影响，在实际中，有100%的准确度基本是不可能的 2.如果出现100%准确度的模型，需要检查是不是错误的引入了和预测变量相关的变量，这种变量对于未来本身就是不确定的。这种情况出现，一来本身就是错误，二来，这样的模型在实践中无法应用。 3.模型的准确性

三星6699 3-1

1

#一天一贴# 模型的准确性高就一定好吗

三星6699

2017-02

建模之外有句话叫做“训练模型”，相当于机器学习的过程，要让他不断的学习，才能越准确的接近于数据过滤。在构建时，切记一个词叫做过度拟合，你有一份数据，通过这份数据构建模型，过度拟合就是说你的模型过度的提取了这份样本数据的特征，将此模型进行应用的时候便会发现，准确性并不高。一个与样本拟合程度过高的模型，已经与实际脱离，失去了应用的价值。过度拟合就是为了达到一致假设，而使假设变得过度严格。防止过拟合

hahahoho10 3-1

1

SmartMining的交互条形图和交互散点图怎么配置

orange121618 2017-02

SmartMining的交互条形图和交互散点图怎么配置？

hahahoho10 2-28

0

#一天一贴# 分类算法与聚类算法

三星6699

2017-02

分类和聚类的既可以独立使用，很多的实践是将二者结合使用上图将分类聚类过程简化，但是从结果上来讲，上图却很直接将二者的应用和结合点表达的很清楚。

三星6699 2-27

1

#一天一贴# 缺失值的处理

三星6699

2017-02

对缺失值进行处理，一是因为很多的算法的使用不能与缺失值兼容，二是缺失值会影响分析的结果。针对于缺失值的处理，一般有以下几种方法。对于缺失值，除了先了解缺失值的情况，更要知道的缺失的原因，以及缺失值本身是否就包含了研究所需的信息。 1.删除：通过SmartMining的<数据审核>节点，可以知道字段的数值分布和缺失值情况，如若字段的缺失值所占比重很高，可以删除，这种方法存在的不足就是会导致信息的缺失。虽说是删除，也

h2o_h2o2 2-24

0

#一天一贴#12贴

三星6699

2017-02

tell me 坚持住数据清洗的小技巧一般来讲，大数据挖掘的计算往往是限制数据挖掘的一个重要因素，海量数据对软件的和设备的计算能力均提出了很大的挑战。所以在清洗数据的第一步是减少数据量，首先从维度上减少，当然首先还需要对数据有很好的掌握，才能确定将哪些维度排除。其次，对于无法使用的数据样本进行筛选，当然这一步比较复杂，主要从两个方面着手，一是，明确研究对象，将不需要的样本排除；二是，属于研究范围的样本，如

三星6699 2-23

1

#一天一贴#第11贴数据挖掘之工具选择

三星6699

2017-02

不管从哪里讲，数据挖掘都是一个难以入手的难事技术难，实践难，结果还具有不可预测性，恰恰也因为如此，数据挖掘的价值非常大。一个适合的产品能够降低学习成本，提升实践价值才是一个好的产品。而SmartMining的产品特色，对于数据挖掘的诸多需求都可以匹配。界面简洁：需求者可以通过界面配置实现对软件整体的迅速了解。操作方便：可拖拽式的操作，和SPSS Modeler（Clementine）的操作方式异曲同工，但是SmartMining是国内研发团队的成果，

h2o_h2o2 2-23

0

#一天一贴#第9天

三星6699

2017-02

看图不懂怎么办图的含义要从分解图开始第一步：图是平面的还是立体的，确定每一个维度的含义，一般图不会超过三个维度；第二步：了解图的维度的含义之后，需要理解点、线或者区域的含义；第三步：颜色，颜色则不外乎颜色的分类及颜色的深浅第四步：关系，图内可能存在的关系，点点间的关系，线与线的关系，其他可能存在的关系我这里有两个简单的交互散点图可以交流一下，通过这两张图都能得到什么信息

三星6699 2-20

1

#一天一贴#第八贴

三星6699

2017-02

本人观点，可以交流，严禁抄袭分析数据时一个难点是数据的行与列的含义，以及行与列之间的转换，在头脑你能清晰的构造出数据的结构，当然，更重要的你要清楚，你需要的数据结构是什么样的，你手里的数据和最终数据结构的差异在哪，针对于数据行列的逻辑，在这样不断思考和实践的过程中会越来越清晰。建议不够熟悉的时候可以用笔画画，写的越多思路越清楚。

orange121618 2-18

0

状态不错

黄小厨1010 2017-02

最近越来越进入状态了。感觉非常不错。希望能顺利

黄小厨1010 2-18

0

#一天一贴#第七贴

三星6699

2017-02

今天上午看了一篇文章，主题大概是：去年火爆的人工智能，今年该何去何从无论是标题党，还是真以此为内容，都是现实第一种反映，有多少人是在炒概念，有多少人是在跟风。一种技术是否能被广泛接受，在于是否能解决问题，用户的需求才是最重要的。没有一颗平淡的心，怎么才能在当今的社会下成功。如果你真的喜欢大数据这个行业，喜欢数据挖掘这项技术，你会坚持多久呢

三星6699 2-16

2

#一天一贴怎么样#就是这么个性

三星6699

2017-02

一天一贴第一帖，没人监督也要坚持第一天分享QQ群：433680482数据挖掘爱好者欢迎加入

青青果果23 2-16

1

#一天一贴#第六贴

三星6699

2017-02

城市套路深，我想回农村，农村路也滑··· 和数据打交道简单的很，尊重数据，尊重数据的真实性性之外，还是尊重数据间的逻辑，虽说是数据的逻辑，但是脱离不了常规的逻辑学，也就是你这样表达，别人看的懂，你如此设计，别人容易使用，增加复杂性，往往都会把自己套死，能理解数据表达的逻辑很考能力。