-
-
112
-
1假如在一个坐标系里,[(50 50), 100]表示点(50 50)拥有100千克的产品,能否用kmeans算法按点之间距离和各点的产品量进行聚类,要求归为一类的各点间距离尽可能小,且产品量总和不超过M
-
1请问大家 授权文件一直没有收到,12个小时了,有什么办法吗
-
3在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。 朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以 及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。 但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的
-
0纯新手,第一次使用SmartMining,遇到的第一个问题是文件导入,还好自己反复琢磨搞定。结果瞬间遇到第二个问题,两个节点之间的连线如何操作?遍寻软件界面和各大网站,都没有找到有用的信息 其实软件很好,像我这种数据小白对SM的全新操作模式非常好奇,强烈要求开发者出一个简单操作版的指导贴——其实就是傻瓜版,方便入门也便于软件推广啊~~~~不然谁来玩???否则完全搞不懂操作, 白浪了这么好的软件!
-
3伙伴们,SmartMining的数据存储类型的:连续 标志 名义 有序 分类具体指代什么
-
3
-
1目前常用的数据库管理系统有: ACCESS、SQL Server、 Oracle、MySQL、FoxPro、Kylin和Sybase等。 作为国内顶级的数据挖掘产品,SmartMining可以读取各类型的数据 桌面版可以直接读取数据库数据,以进行数据挖掘,软件与数据库的便捷互动为数据的处理存储提供了便利,通过服务器版能对数据的使用权限和用户权限进一步管理,保证了数据的安全性。 单独讲数据库的话 数据库一般分为三种,即层次式数据库、网络式数据库和关系式数据库三种,而不同的数据库
-
1要大数据,要云计算,潮流不重要,能带来实际价值才行 smartmining懂大数据的价值在哪里
-
0但愿不是自己少见多怪,原来smartmining可以同时运行多个工作空间,一个项目一个工作空间并行,不干扰,太棒了
-
6
-
0数据挖掘过程经常涉及到各种类型数据的表现的分析。 当然首先需要看数据的缺失和值的分布情况,而最直观的方式,莫过于透过图来看数据,值的分析,字符型、布尔型取值分布、对比,数值数据的发展趋势。 通过SmartMining的可视化探索,能够轻松获取更多信息,可以通过哪些图形进行数据的探索: 直方图,条形图、线图、地图、词云,各种交互视图。
-
1
-
4[2017年03月28日 11:23:15][警告] ColConvertSelfNodeModel 在3单元的值无法分析,第一个错误: '微博' (RowKey: Row0, 位置: 1) 就算用自带的类型转换也是错误,求大神告知为什么
-
3
-
2很多人都说做数据挖掘,要会从数据中学习,养成数据思维,可是谁能告诉我要怎么做才行
-
4几种合并的区别在哪,求解答
-
2什么是数据挖掘中的关联分析,求解答
-
1一个字,难 而且是很难,难在分析思路,难在需要找到契合的数据挖掘工具,难在算法的学习和应用,学习成本高 原谅我的吐槽
-
1今天必须要分享一点,有些人会想能不能数据造假,使得结果漂亮一些。 做数据,底线就是尊重数据的真实性。数据挖掘总能给人惊喜的一点是,总能给您一些意想不到的结果,意料之外收获才是数据挖掘最大的价值吧。
-
1服务器版的部分功能需要结合桌面版才可以。但是云版结合了桌面版和服务器版的功能,计算能力更强
-
1多多实践,找数据联系 能参加比赛就参加比赛 能参加项目就参加项目 让自己多与数据挖掘接触 自然而然的形成一套数据挖掘思维
-
2
-
4
-
2对数据挖掘的喜爱源自于对于发现未知的兴奋,偶然的机会尝试使用SmartMining数据挖掘软件,用它做数据分析,只要想的到的需求一般都可以满足,简单拖拽,连接就能完成数据分析,不需要检查代码,不需要担心数据安全。 使用SmartMining做了几个数据分析尝试后,就不放下这款好用的软件了。真希望更多人能够发现她
-
1作为强大的数据挖掘软件,SmartMining敏捷挖掘产品桌面版,能够通过桌面安装使用,使得人人都能轻松体验数据挖掘。 想了解SmartMining操作界面,可以查看我上一篇的帖子 根据算法功能将算法分为以下几个部分: * 数据源模块 用来读取不同文件格式的数据。提供了各种数据源的读取接口,通过简单的配置连接更多数据库、数据文本文件。 *数据准备模块 通过数据准备模块实现对数据的清洗整理工作。 此模块包含丰富数据处理节点(算法)。根据处理
-
3哪位大神知道,求解啊
-
1
-
1K-Means算法是一个聚类算法,把N的对象根据他们的属性分为k个分割(k<N),K-聚类算法从一个目标集中创建多个组,每个组的成员都是比较相似的。 基本步骤: (1)从 n个数据对象任意选择 k 个对象作为初始聚类中心; (2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分; (3)重新计算每个(有变化)聚类的均值(中心对象); (4)计算标准测度函数,当满足一定条件,
-
1SmartMining将apriori算法封装,能够实现轻松的关联分析。 购物篮分析作为关联分析的经典应用,使得很多人能够了解关联分析的应用。但是也有很多人认为关联分析只能做购物篮分析就不对啦 关联分析的关键在于找到事务项之间是否存在内在联系,以及关系的特征
-
1很多人在开始学习数据挖掘算法时,会进入一个误区,将学习的案例当作算法本身,不能跳出,案例只是算法应用的一个小的方面。 算法是一种方法或者说一个工具,如何应用需要头脑灵活。 。。当然不够 了解算法的核心,对算法有通透的掌握,对数据有清洗的把握,这时候可以做到将算法和应用灵活结合
-
0神经网络算法(Neural Network) ,神经网络是模拟人类大脑处理信息方式的简化模型。作为分类预测的算法之一,神经网络属于监督学习。分析此模型通过模拟大量类似于神经元的抽象形式的互连处理单元而运行。这些处理单元都位于层中。 通常在神经网络中有三个部分:一个输入层,其中的单元表示输入字段;一个或多个隐藏层;一个输出层,带有一个或多个表示目标字段的单元。 这些单元通过可变的连接强度(或权重)连接。输入数据显示在第一
-
1国产Kylin有人将之成为大数据分析界的“神兽”。 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的很多业务分析工具往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL,Hadoop难以实现快速交互式查询等等。神兽Apache Kylin就是为了解决这些问题而设计的。 Apache Kylin是一个开源的分布式分析引擎,为Hadoop等大型分布式
-
0
-
0地图作为数据挖掘可视化的重要手段应用的越来越广泛 也又不少人理不清地图究竟能展示哪些信息 地图上主要看的是: 区域的含义,点的含义,线的含义,颜色的含义 区域:一个区域代表了一个地理位置,包含了位置信息和区域的面积信息 点:同样点可以代表一个地理位置,点的大小则包含了数量信息,另外,点的形状是一个分类 线:第一个线,区域的边界,第二个线,位置间的关联,第三个带有方向的线,包含了流动信息,第四个线,流动的不
-
0从商业应用上看模型的准确定,就需要从数据和应用实际出发。尤其对于预测类的模型,数据的分布要有清晰的掌握。列明几点: 1.在商业应用中,不可能获取到全部因素,同时还有随机因素影响,在实际中,有100%的准确度基本是不可能的 2.如果出现100%准确度的模型,需要检查是不是错误的引入了和预测变量相关的变量,这种变量对于未来本身就是不确定的。这种情况出现,一来本身就是错误,二来,这样的模型在实践中无法应用。 3.模型的准确性
-
1建模之外有句话叫做“训练模型”,相当于机器学习的过程,要让他不断的学习,才能越准确的接近于数据过滤。 在构建时,切记一个词叫做过度拟合,你有一份数据,通过这份数据构建模型,过度拟合就是说你的模型过度的提取了这份样本数据的特征,将此模型进行应用的时候便会发现,准确性并不高。 一个与样本拟合程度过高的模型,已经与实际脱离,失去了应用的价值。 过度拟合就是为了达到一致假设,而使假设变得过度严格。 防止过拟合
-
1SmartMining的交互条形图和交互散点图怎么配置?
-
0
-
1
-
0tell me 坚持住 数据清洗的小技巧 一般来讲,大数据挖掘的计算往往是限制数据挖掘的一个重要因素,海量数据对软件的和设备的计算能力均提出了很大的挑战。 所以在清洗数据的第一步是减少数据量,首先从维度上减少,当然首先还需要对数据有很好的掌握,才能确定将哪些维度排除。其次,对于无法使用的数据样本进行筛选,当然这一步比较复杂,主要从两个方面着手,一是,明确研究对象,将不需要的样本排除;二是,属于研究范围的样本,如
-
1不管从哪里讲,数据挖掘都是一个难以入手的难事 技术难,实践难,结果还具有不可预测性,恰恰也因为如此,数据挖掘的价值非常大。一个适合的产品能够降低学习成本,提升实践价值才是一个好的产品。 而SmartMining的产品特色,对于数据挖掘的诸多需求都可以匹配。 界面简洁: 需求者可以通过界面配置实现对软件整体的迅速了解。 操作方便: 可拖拽式的操作,和SPSS Modeler(Clementine)的操作方式异曲同工,但是SmartMining是国内研发团队的成果,
-
0
-
1本人观点,可以交流,严禁抄袭 分析数据时一个难点是数据的行与列的含义,以及行与列之间的转换,在头脑你能清晰的构造出数据的结构,当然,更重要的你要清楚,你需要的数据结构是什么样的,你手里的数据和最终数据结构的差异在哪,针对于数据行列的逻辑,在这样不断思考和实践的过程中会越来越清晰。建议不够熟悉的时候可以用笔画画,写的越多思路越清楚。
-
0最近越来越进入状态了。感觉非常不错。希望能顺利
-
0今天上午看了一篇文章,主题大概是:去年火爆的人工智能,今年该何去何从 无论是标题党,还是真以此为内容,都是现实第一种反映,有多少人是在炒概念,有多少人是在跟风。一种技术是否能被广泛接受,在于是否能解决问题,用户的需求才是最重要的。没有一颗平淡的心,怎么才能在当今的社会下成功。 如果你真的喜欢大数据这个行业,喜欢数据挖掘这项技术,你会坚持多久呢
-
2一天一贴第一帖,没人监督也要坚持 第一天分享QQ群:433680482数据挖掘爱好者欢迎加入
-
1城市套路深,我想回农村,农村路也滑··· 和数据打交道简单的很,尊重数据,尊重数据的真实性性之外,还是尊重数据间的逻辑,虽说是数据的逻辑,但是脱离不了常规的逻辑学,也就是你这样表达,别人看的懂,你如此设计,别人容易使用,增加复杂性,往往都会把自己套死,能理解数据表达的逻辑很考能力。