文本挖掘

  • R语言文本挖掘和词云可视化实践

    互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个初步尝试。飞信群是我们在工作、生活中交流的重要平台,在将近一年的时间里共产生了几万条的聊天记录,展现了我们这个团队的方方面面。 本文将通过KNIME、R语言和tagxedo三个…

    2015-11-01
    0
  • 面向程序员的数据挖掘指南7:朴素贝叶斯和文本数据

    非结构化文本的分类算法 在前几个章节中,我们学习了如何使用人们对物品的评价(五星、顶和踩)来进行推荐;还使用了他们的隐式评价——买过什么,点击过什么;我们利用特征来进行分类,如身高、体重、对法案的投票等。这些数据有一个共性——能用表格来展现: 因此这类数据我们称为“结构化数据”——数据集中的每条数据(上表中的一行)由多个特征进行描述(上表中的列)。而非结构化…

    2015-05-07
    0
  • FindMyCarrots利用语义搜索和大数据简化旅游规划

    来自印度的新创旅行搜索引擎公司Findmycarrots 相信,当人们准备做旅行规划时,选择目的地比选择酒店、线路等旅游产品更重要、更费时。

    2013-10-19
    0
关注我们
关注我们
分享本页
返回顶部