smartmining吧
关注: 28 贴子: 294

  • 目录:
  • 112
    谁说菜鸟不会分析系列 包括入门篇 工具篇 SPSS篇 完整pdf 想要的留下邮箱,免费发送哦
  • 1
    假如在一个坐标系里,[(50 50), 100]表示点(50 50)拥有100千克的产品,能否用kmeans算法按点之间距离和各点的产品量进行聚类,要求归为一类的各点间距离尽可能小,且产品量总和不超过M
  • 1
    请问大家 授权文件一直没有收到,12个小时了,有什么办法吗
    setup3d 6-27
  • 3
    在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。 朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以 及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。 但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的
    比机 1-23
  • 0
    纯新手,第一次使用SmartMining,遇到的第一个问题是文件导入,还好自己反复琢磨搞定。结果瞬间遇到第二个问题,两个节点之间的连线如何操作?遍寻软件界面和各大网站,都没有找到有用的信息 其实软件很好,像我这种数据小白对SM的全新操作模式非常好奇,强烈要求开发者出一个简单操作版的指导贴——其实就是傻瓜版,方便入门也便于软件推广啊~~~~不然谁来玩???否则完全搞不懂操作, 白浪了这么好的软件!
  • 3
    伙伴们,SmartMining的数据存储类型的:连续 标志 名义 有序 分类具体指代什么
  • 3
    SmartMining自带的帮助,从分类预测到关联分析、甚至文本挖掘案例 包含了数据、操作方法每个模型的说明,每个建模方法的使用
  • 1
    目前常用的数据库管理系统有: ACCESS、SQL Server、 Oracle、MySQL、FoxPro、Kylin和Sybase等。 作为国内顶级的数据挖掘产品,SmartMining可以读取各类型的数据 桌面版可以直接读取数据库数据,以进行数据挖掘,软件与数据库的便捷互动为数据的处理存储提供了便利,通过服务器版能对数据的使用权限和用户权限进一步管理,保证了数据的安全性。 单独讲数据库的话 数据库一般分为三种,即层次式数据库、网络式数据库和关系式数据库三种,而不同的数据库
    hahahoho10 6-23
  • 1
    要大数据,要云计算,潮流不重要,能带来实际价值才行 smartmining懂大数据的价值在哪里
  • 0
    但愿不是自己少见多怪,原来smartmining可以同时运行多个工作空间,一个项目一个工作空间并行,不干扰,太棒了
  • 6
    今天分享点什么呢 SmartMining作为大数据挖掘软件,有一股势不可挡的力量,但是作为一款专业的数据挖掘软件,还是很容易让人望而生畏,其实,真的想说,这款产品太容易使用了 今天就来看看她的界面有多简单就知道了 五个功能区域,分别为:菜单栏,节点库和浏览区,工作流操作区,大纲,消息区 菜单栏:包含软件的配置菜单和多种操作按钮 (工作按钮既可以单击使用,也可以通过鼠标右键单击获取相应功能) 节点库:每一个节点就是一个封
  • 0
    数据挖掘过程经常涉及到各种类型数据的表现的分析。 当然首先需要看数据的缺失和值的分布情况,而最直观的方式,莫过于透过图来看数据,值的分析,字符型、布尔型取值分布、对比,数值数据的发展趋势。 通过SmartMining的可视化探索,能够轻松获取更多信息,可以通过哪些图形进行数据的探索: 直方图,条形图、线图、地图、词云,各种交互视图。
  • 1
    如图,主成分分析结果里面有PCA0 PCA1什么的 这是什么意思啊?
    三星6699 4-14
  • 4
    [2017年03月28日 11:23:15][警告] ColConvertSelfNodeModel 在3单元的值无法分析,第一个错误: '微博' (RowKey: Row0, 位置: 1) 就算用自带的类型转换也是错误,求大神告知为什么
  • 3
    1.充分学习数据,对原始数据的内容和格式充分的了解。 2.业务学习,从业务角度出发,确定适合的可视化手段。 3.找到业务与数据之间的关联,业务信息对应是分类字段,还是连续字段,亦或是主要强调的是趋势信息或者对比信息。不同的图形展现的信息侧重点不同,找准图形。 4.不同的图形对数据表的格式要求亦不相同,一般来讲,默认的数据很少能完美的契合图形对数据的要求。此时,数据的准备就很重要了。 5.数据可视化的信息是否足够丰富
    h2o_h2o2 3-18
  • 2
    很多人都说做数据挖掘,要会从数据中学习,养成数据思维,可是谁能告诉我要怎么做才行
    h2o_h2o2 3-17
  • 4
    几种合并的区别在哪,求解答
    h2o_h2o2 3-17
  • 2
    什么是数据挖掘中的关联分析,求解答
    h2o_h2o2 3-17
  • 1
    一个字,难 而且是很难,难在分析思路,难在需要找到契合的数据挖掘工具,难在算法的学习和应用,学习成本高 原谅我的吐槽
  • 1
    今天必须要分享一点,有些人会想能不能数据造假,使得结果漂亮一些。 做数据,底线就是尊重数据的真实性。数据挖掘总能给人惊喜的一点是,总能给您一些意想不到的结果,意料之外收获才是数据挖掘最大的价值吧。
  • 1
    服务器版的部分功能需要结合桌面版才可以。但是云版结合了桌面版和服务器版的功能,计算能力更强
  • 1
    多多实践,找数据联系 能参加比赛就参加比赛 能参加项目就参加项目 让自己多与数据挖掘接触 自然而然的形成一套数据挖掘思维
    hahahoho10 3-17
  • 2
    很多企业和个人想了解大数据挖掘工具有哪些,于是乎,各种平台搜索,查找,找到回来发现没有满足最开始的需求。 有些人可以推荐百十余种工具,但是对我们而言一个产品就可以了,很多开源小工具学习探路都不足够,不用说企业级应用和科学研究了。 易用性和学习成本对比来讲,选择敏捷挖掘产品都是最合算的,可以免费试用,而且操作方式简单,双击或者拖拽加载算法,不需要码代码,也可以使用各种高级算法。 大数据挖掘关键就在于对数
    三星6699 3-17
  • 4
    张小龙说,如果求职者说自己看完了凯文·凯利的《失控》,面试就可以愉快地结束了,我一定会录用ta。如果做互联网产品的不看一下这本书,我认为知识是不全面的。 失控这本书,十个和你推荐它的人,七个自己没看完,至多一个读完,还有两个可能只是买回来发一下朋友圈。买完这本书就后悔了,因为你真的想把它读完,个人建议,如果阅读能力允许,买英文原版的来读,收益更大。 《失控》二十四章主题 甚至有人说“要是都看得懂,那还不
    hahahoho10 3-16
  • 2
    对数据挖掘的喜爱源自于对于发现未知的兴奋,偶然的机会尝试使用SmartMining数据挖掘软件,用它做数据分析,只要想的到的需求一般都可以满足,简单拖拽,连接就能完成数据分析,不需要检查代码,不需要担心数据安全。 使用SmartMining做了几个数据分析尝试后,就不放下这款好用的软件了。真希望更多人能够发现她
    hahahoho10 3-16
  • 1
    作为强大的数据挖掘软件,SmartMining敏捷挖掘产品桌面版,能够通过桌面安装使用,使得人人都能轻松体验数据挖掘。 想了解SmartMining操作界面,可以查看我上一篇的帖子 根据算法功能将算法分为以下几个部分: * 数据源模块 用来读取不同文件格式的数据。提供了各种数据源的读取接口,通过简单的配置连接更多数据库、数据文本文件。 *数据准备模块 通过数据准备模块实现对数据的清洗整理工作。 此模块包含丰富数据处理节点(算法)。根据处理
    hahahoho10 3-16
  • 3
    哪位大神知道,求解啊
    h2o_h2o2 3-16
  • 1
    1.椭圆的画法 2.杨辉三角问题(杨辉三角是二项式系数在三角形中的一种几何排列。也叫做帕斯卡三角形) 3.使用“FOIL”轻松的解决二项式乘法 4.矩阵转置的技巧 5.勾股定理(直角三角形两直角边(即“勾”,“股”)边长平方和等于斜边(即“弦”)边长的平方) 6.多边形的外角之和总是等于360度(虽然移动,但是角度) 7.圆周率π(圆的周长与直径的比值) 8.在Y轴上使用正弦(红色),在X轴上使用余弦(蓝色),则在XY轴平面上画出的环形(黑色) 9.同前一原
    h2o_h2o2 3-16
  • 1
    K-Means算法是一个聚类算法,把N的对象根据他们的属性分为k个分割(k<N),K-聚类算法从一个目标集中创建多个组,每个组的成员都是比较相似的。 基本步骤: (1)从 n个数据对象任意选择 k 个对象作为初始聚类中心; (2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分; (3)重新计算每个(有变化)聚类的均值(中心对象); (4)计算标准测度函数,当满足一定条件,
    h2o_h2o2 3-16
  • 1
    SmartMining将apriori算法封装,能够实现轻松的关联分析。 购物篮分析作为关联分析的经典应用,使得很多人能够了解关联分析的应用。但是也有很多人认为关联分析只能做购物篮分析就不对啦 关联分析的关键在于找到事务项之间是否存在内在联系,以及关系的特征
  • 1
    很多人在开始学习数据挖掘算法时,会进入一个误区,将学习的案例当作算法本身,不能跳出,案例只是算法应用的一个小的方面。 算法是一种方法或者说一个工具,如何应用需要头脑灵活。 。。当然不够 了解算法的核心,对算法有通透的掌握,对数据有清洗的把握,这时候可以做到将算法和应用灵活结合
  • 0
    神经网络算法(Neural Network) ,神经网络是模拟人类大脑处理信息方式的简化模型。作为分类预测的算法之一,神经网络属于监督学习。分析此模型通过模拟大量类似于神经元的抽象形式的互连处理单元而运行。这些处理单元都位于层中。 通常在神经网络中有三个部分:一个输入层,其中的单元表示输入字段;一个或多个隐藏层;一个输出层,带有一个或多个表示目标字段的单元。 这些单元通过可变的连接强度(或权重)连接。输入数据显示在第一
    三星6699 3-11
  • 1
    国产Kylin有人将之成为大数据分析界的“神兽”。 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的很多业务分析工具往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL,Hadoop难以实现快速交互式查询等等。神兽Apache Kylin就是为了解决这些问题而设计的。 Apache Kylin是一个开源的分布式分析引擎,为Hadoop等大型分布式
  • 0
    Hadoop是一个开发和运行处理大规模数据的软件平台。 一,Hadoop是一个开源的框架; 二,Hadoop能够进行大规模数据集地分布式处理; 三,Hadoop能够用计算机集群存储海量数据; 四,Hadoop可以从单一服务器扩展到成千上万的服务器,这些服务都能够提供本地化的存储和计算; 五,Hadoop具有能够检测和处理应用层错误的能力; 六,Hadoop包括Hadoop common/HDFS/Hadoop YARN/Hadoop MapReduce四个模块,每个模块负责各自的事务。 Hadoop得以在大数据处理应用中广泛应用得
  • 0
    地图作为数据挖掘可视化的重要手段应用的越来越广泛 也又不少人理不清地图究竟能展示哪些信息 地图上主要看的是: 区域的含义,点的含义,线的含义,颜色的含义 区域:一个区域代表了一个地理位置,包含了位置信息和区域的面积信息 点:同样点可以代表一个地理位置,点的大小则包含了数量信息,另外,点的形状是一个分类 线:第一个线,区域的边界,第二个线,位置间的关联,第三个带有方向的线,包含了流动信息,第四个线,流动的不
  • 0
    从商业应用上看模型的准确定,就需要从数据和应用实际出发。尤其对于预测类的模型,数据的分布要有清晰的掌握。列明几点: 1.在商业应用中,不可能获取到全部因素,同时还有随机因素影响,在实际中,有100%的准确度基本是不可能的 2.如果出现100%准确度的模型,需要检查是不是错误的引入了和预测变量相关的变量,这种变量对于未来本身就是不确定的。这种情况出现,一来本身就是错误,二来,这样的模型在实践中无法应用。 3.模型的准确性
  • 1
    建模之外有句话叫做“训练模型”,相当于机器学习的过程,要让他不断的学习,才能越准确的接近于数据过滤。 在构建时,切记一个词叫做过度拟合,你有一份数据,通过这份数据构建模型,过度拟合就是说你的模型过度的提取了这份样本数据的特征,将此模型进行应用的时候便会发现,准确性并不高。 一个与样本拟合程度过高的模型,已经与实际脱离,失去了应用的价值。 过度拟合就是为了达到一致假设,而使假设变得过度严格。 防止过拟合
  • 1
    SmartMining的交互条形图和交互散点图怎么配置?
    hahahoho10 2-28
  • 0
    分类和聚类的既可以独立使用,很多的实践是将二者结合使用 上图将分类聚类过程简化,但是从结果上来讲,上图却很直接将二者的应用和结合点表达的很清楚。
    三星6699 2-27
  • 1
    对缺失值进行处理,一是因为很多的算法的使用不能与缺失值兼容,二是缺失值会影响分析的结果。 针对于缺失值的处理,一般有以下几种方法。对于缺失值,除了先了解缺失值的情况,更要知道的缺失的原因,以及缺失值本身是否就包含了研究所需的信息。 1.删除:通过SmartMining的<数据审核>节点,可以知道字段的数值分布和缺失值情况,如若字段的缺失值所占比重很高,可以删除,这种方法存在的不足就是会导致信息的缺失。虽说是删除,也
    h2o_h2o2 2-24
  • 0
    tell me 坚持住 数据清洗的小技巧 一般来讲,大数据挖掘的计算往往是限制数据挖掘的一个重要因素,海量数据对软件的和设备的计算能力均提出了很大的挑战。 所以在清洗数据的第一步是减少数据量,首先从维度上减少,当然首先还需要对数据有很好的掌握,才能确定将哪些维度排除。其次,对于无法使用的数据样本进行筛选,当然这一步比较复杂,主要从两个方面着手,一是,明确研究对象,将不需要的样本排除;二是,属于研究范围的样本,如
    三星6699 2-23
  • 1
    不管从哪里讲,数据挖掘都是一个难以入手的难事 技术难,实践难,结果还具有不可预测性,恰恰也因为如此,数据挖掘的价值非常大。一个适合的产品能够降低学习成本,提升实践价值才是一个好的产品。 而SmartMining的产品特色,对于数据挖掘的诸多需求都可以匹配。 界面简洁: 需求者可以通过界面配置实现对软件整体的迅速了解。 操作方便: 可拖拽式的操作,和SPSS Modeler(Clementine)的操作方式异曲同工,但是SmartMining是国内研发团队的成果,
    h2o_h2o2 2-23
  • 0
    看图不懂怎么办 图的含义要从分解图开始 第一步:图是平面的还是立体的,确定每一个维度的含义,一般图不会超过三个维度; 第二步:了解图的维度的含义之后,需要理解点、线或者区域的含义; 第三步:颜色,颜色则不外乎颜色的分类及颜色的深浅 第四步:关系,图内可能存在的关系,点点间的关系,线与线的关系,其他可能存在的关系 我这里有两个简单的交互散点图 可以交流一下,通过这两张图都能得到什么信息
    三星6699 2-20
  • 1
    本人观点,可以交流,严禁抄袭 分析数据时一个难点是数据的行与列的含义,以及行与列之间的转换,在头脑你能清晰的构造出数据的结构,当然,更重要的你要清楚,你需要的数据结构是什么样的,你手里的数据和最终数据结构的差异在哪,针对于数据行列的逻辑,在这样不断思考和实践的过程中会越来越清晰。建议不够熟悉的时候可以用笔画画,写的越多思路越清楚。
  • 0
    最近越来越进入状态了。感觉非常不错。希望能顺利
  • 0
    今天上午看了一篇文章,主题大概是:去年火爆的人工智能,今年该何去何从 无论是标题党,还是真以此为内容,都是现实第一种反映,有多少人是在炒概念,有多少人是在跟风。一种技术是否能被广泛接受,在于是否能解决问题,用户的需求才是最重要的。没有一颗平淡的心,怎么才能在当今的社会下成功。 如果你真的喜欢大数据这个行业,喜欢数据挖掘这项技术,你会坚持多久呢
    三星6699 2-16
  • 2
    一天一贴第一帖,没人监督也要坚持 第一天分享QQ群:433680482数据挖掘爱好者欢迎加入
  • 1
    城市套路深,我想回农村,农村路也滑··· 和数据打交道简单的很,尊重数据,尊重数据的真实性性之外,还是尊重数据间的逻辑,虽说是数据的逻辑,但是脱离不了常规的逻辑学,也就是你这样表达,别人看的懂,你如此设计,别人容易使用,增加复杂性,往往都会把自己套死,能理解数据表达的逻辑很考能力。
    h2o_h2o2 2-16

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

会员: 会员

目录: