数据挖掘:R语言实战
  • 推荐0
  • 收藏5
  • 浏览2.8K

数据挖掘:R语言实战

王正林 , 王正林 (作者) 

  • 丛  书:大数据时代的R语言
  • 书  号:978-7-121-23122-3
  • 出版日期:2014-06-09
  • 页  数:304
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:张月萍
本书结合大量的实例对R语言中数据挖掘领域算法包进行详细的讲述,基于实战需求,详细讲解实例的完整分析过程,并将算法模型和R语言的应用融于实例分析之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据挖掘精髓的领悟以及对R软件应用的掌握。
实例实例覆盖了常见的数据挖掘技术,机器学习技术,全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容,脉络清晰,并且各章自成体系。读者可以从头至尾逐章学习,也可以根据自己的需要进行学习,找到自己实际问题的解决方案。
覆盖R语言、数据挖掘、机器学习三大技术热点。

目录

读者评论

  • 运行神经网络程序出现很多错误

    第一种建模格式

    wine=read.table(“d:\wine.txt”) # 本文默认数据以记事本格式存储于电脑D盘中
    names(wine)=c(“fixed”,”volatile”,”citric”,”residual”,”chlorides”,”free”,”total”,”density”,”PH”,”sulphates”,”alcohol”,”quality”)# 为每一个变量命名
    set.seed(71)
    samp=sample(1:4898,3000) # 从总样本集中抽取3000个样本作为训练集
    wine[samp,1:11]=scale01(wine[samp,])# 对样本进行预处理
    Warning message:
    In matrix(value, n, p) : 数据长度[39000]不是矩阵列数[11]的整倍数
    r=1/max(abs(wine[samp,1:11]))# 确定参数rang的变化范围
    set.seed(101)
    model1=nnet(quality~.,data=wine,subset=samp,size=4,rang=r,decay=5e-4,maxit=200)# 建立神经网络模型
    Error in terms.formula(formula, data = data) :
    在数据框里用’.’时不能有重复的名字’NA’

    第二种建模格式

    x=subset(wine,select=-quality)# 提取wine数据中除quality列以外的数据作为自变量
    y=wine[,12]# 提取wine数据中的quality列数据作为响应变量
    y=class.ind(y)# 对响应变量进行预处理,将其变为类指标矩阵
    set.seed(101)
    model2=nnet(x,y,decay=5e-4,maxit=200,size=4,rang=r) # 建立神经网络模型
    Error in nnet.default(x, y, decay = 5e-04, maxit = 200, size = 4, rang = r) :
    missing values in ‘x’

    针对第一种格式进行预测

    x=wine[,1:11]# 确认需要进行预测的样本特征矩阵
    pred=predict(model1,x,type=”class”)# 根据模型model1对xt数据进行预测
    错误: unexpected input在”pred=predict(model1,x,type=””里
    set.seed(110)
    pred[sample(1:4898,8)]# 随机挑选8个预测结果进行展示

    <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
    NA NA NA NA NA NA NA NA

    wlou64发表于 2021/12/11 9:23:32
  • 怎么没有案例数据下载啊?

    John发表于 2021/11/6 12:28:54

同系列书

  • 数据分析:R语言实战

    肖静 (作者)

    本书讲述如何利用R语言进行数据控制、处理、整理、分析等方面的具体细节和基本要点,结合大量的实例,从实战的角度出发,讲解实例的完整分析过程,并将算法模型和R语言软...

    ¥59.00
  • 数据挖掘:R语言实战

    本书结合大量的实例对R语言中数据挖掘领域算法包进行详细的讲述,基于实战需求,详细讲解实例的完整分析过程,并将算法模型和R语言的应用融于实例分析之中,使读者在阅读...

    ¥56.00