怎么用r做数据分析 如何利用R软件简单处理文本数据? 首发

颈凉骨 阅读:96次 时间:2024-07-03 09:58:13
最佳经验
由作者撰写原创经验并推荐置顶

本文介绍如何利用R中tm包分析文本数据,以及用wordcloud绘制词云图的具体方法,以下内容是由微蓝经验网用户发布怎么用r做数据分析 如何利用R软件简单处理文本数据?希望对于用户有一定帮助,为朋友进行解决疑惑,如若想了解更多相关内容,可以向底部移动了解更多与本教程文章相关解决经验方法!

工具与材料

R;tm;wordcloud

方法/步骤
  1. 1/6

    将要分析的文本文档存在一个目录里,加载程序包tm,利用函数Corpus处理文档,代码如下:

    library(tm)

    #读取文件夹名

    filename<-"C:/Users/jsb/Desktop/txt"

    #语料库,DirSource处理目录

    text<-Corpus(DirSource(filename),readerControl = list(language="lat"))

    summary(text)

    要处理的目录中有两个文档,文档名称和类别。

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
  2. 2/6

    读取文档目录后,可以用函数inspect查看文档,查看单个文档要加双括号,#语料库的提取

    inspect(text[1:2])

    #提取单个文档

    identical(text[[1]],text[["text,txt"]])

    text[[1]]

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
  3. 3/6

    利用tm_map函数对文本进行一些处理,#去除空白

    text<- tm_map(text, stripWhitespace)

    #小写变换

    text<-tm_map(text,tolower)

    #停止词去除

    text<-tm_map(text,removeWords,stopwords("english"))

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
  4. 4/6

    wordcloud包中的wordcloud函数绘制词云图,#词云图

    > library(wordcloud)

    > wordcloud(text)

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
  5. 5/6

    利用DocumentTermMatrix 生成文档关系矩阵,这是建立模型的基础,#文档关系矩阵

    dtm<-DocumentTermMatrix(text)

    inspect(dtm[1:2,1:20])

    结果中可以看到前两个文档中20个词语出现的频次表。

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
  6. 6/6

    从文档关系矩阵出找出我们关心的词,例如:

    #找出出现6次以上的条目

    findFreqTerms(dtm,6)

    #找到与"program"的相关系数在0,8以上的条目

    findAssocs(dtm, "program", 0,8)

    怎么用r做数据分析 如何利用R软件简单处理文本数据?
注意与说明

如果文档是中文本文,需要将编码设置为“UTF-8”的格式,否则读出的文本会出现乱码,以上经验结束,与怎么用r做数据分析 如何利用R软件简单处理文本数据?有关的经验教程内容,若解决问题请点击“有用”,没有解决请向下浏览“相关”内容或点击“无用”平台积极改进优质原创的内容文章,点击下方工具分享给更多的朋友吧!

相关评论发表评论

声明 未经许可,请勿转载。

Excel2019如何对一列数据进行分列处理,教你几招尝试解决!
简单几步学会用photoshop软件制作gif动态图片
安装软件时提示解析包时出现问题怎么处理
SPSS处理数据:[1]计算均值,中位数,众数
用美图秀秀替换和修改图片中的文本,超简单!
Stata处理异常数据(可批量,缩尾或直接删除)
怎样在Excel计算相对标准偏差来处理数据
桌面软件快捷方式图标不见了怎么处理
如何处理数据很少文件却很大的Excel表格
如何利用GraphPadPrism软件分析QPCR数据
如何处理U盘数据错误循环冗余检查

新手帮助反馈投诉免责声明服务协议

© 2025 VLPOS.com 版权所有 微蓝网 ICP备案号:黑ICP备20003952号-1