问豆首页 多问问答 知识问答 文档下载 文档搜索 文档下载导航 文档大全导航
设为首页 | 加入收藏
搜索 请输入内容:  
 导航当前位置: 文档下载 > 所有分类 > IT/计算机 > 互联网 > 用PU学习算法做文本挖掘
免费下载此文档侵权投诉

用PU学习算法做文本挖掘

正例和无标记样本学习(Learning from Positive and Unlabeled examples)一般称为LPU或PU学习。PU学习是一种常用的半监督的二元分类模型,它的目的是通过已标注的正例数据和大量的未标注数据训练出一个用于区分正反分类的分类器。

用PU学习算法做文本挖掘

这个方向国内也有类似,甚至可能更前瞻的基于社交化数据挖掘, 提炼出个性化推荐。火花无线, 一家O2O的无线新秀所推出的美食推荐应用, 麻花, 就是一个典型案例。作为一部分基础数据, 该应用挖掘了新浪微博上有关餐厅的微博分享, 并汇集成热门餐厅。我们来看一下麻花是怎样在新浪微博等SNS上做数据挖掘的。

图12-3麻花界面示意图

为了给用户最个性化和最高价值的过程中, 该应用进一步通过互粉关系, 把互粉用户所推荐的内容提高权重,推荐给用户, 从而提高推荐餐馆的相关度和增加搜索结果的可信度。 说起来很简单,但是在这里比较关键的是如何从用户的某条微博中发现地点和判断用户是对该地点做出评论。不是每条包含地点的微博都是对地点的推荐。比如

“我在贝塔咖啡吃午饭”

或者

“今天去福地听讲座”

这些微博虽然提到了地点,但只能算是一个“check-in”,并不是对这些地点的评价。

用PU学习算法做文本挖掘

第1页

免费下载Word文档免费下载:用PU学习算法做文本挖掘

(下载1-3页,共3页)

你可能喜欢

  • 电子商务数据分析
  • 电子商务运营
  • 电子商务数据挖掘
  • 数据技术
  • 电商数据
  • 碎片化时代
  • 美国大学排名
  • 电子商务课件

我要评论

相关文档

  • 贪心算法 学习文档

    用PU学习算法做文本挖掘 3页 1下载券 一种基于贪心EM算法学习... 4页 1...第4章 贪心算法 wxf80106@126.com 1 OUTLINE 1、背包问题 2、贪心算法的...

  • 数据挖掘中的文本挖掘的分类算法综述

    数据挖掘中的文本挖掘的分类算法综述_IT/计算机_专业资料。数据挖掘文本挖掘的...数据挖掘利用了来自如下一些领域的思想:(1) 来自统计的抽样、估计和 假设检验...

  • 聚类算法在Web文本挖掘中的应用研究

    4 Web文本聚类算法 4.1传统聚类算法与Web文本聚类算法的比较作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文 档手工标注类别,因此具有...

  • 基于改进遗传算法的Web文本挖掘系统

    27 卷 4 期第 2010 年 4 月 微电子与计算机 M ICRO EL ECTRON ICS & COM PU TER Vol. 27 4 No. April 2010 基于改进遗传算法的 Web 文本挖掘系统...

  • 基于图划分的谱聚类算法文本挖掘中应用

    基于图划分的谱聚类算法文本挖掘中应用_工学_高等教育_教育专区。谱聚类...机器学习及其应用[ M] . 北京 : 清华大学出 钰 从表 1 可以看出 ,无论是...

  • 基于朴素贝叶斯的文本挖掘算法研究

    基于朴素贝叶斯的文本挖掘算法研究_计算机软件及应用_IT/计算机_专业资料。辽宁...贝叶斯学习理论及其应用研究.博士论文。2002. [6] 吴云芳,王淼,金澎,俞士汶...

  • 文本挖掘与机器学习

    文本挖掘与机器学习 1 文本挖掘的背景和意义上世纪九十年代初,美国提出了"国家...贝叶斯推理为直接操作概率的学习算法提供 了基础,也为其他算法的分析提供了理论...

  • 【论文】基于VSM的文本分类挖掘算法综述

    基于VSM的文本分类挖掘算法综述_专业资料。简要介绍了VSM和文本分类挖掘的流程,分析了基于统计方法和基于机器学习的6种常用构造文本分类挖掘分类器的算法,指出了利用...

更多文档:

站点地图 | 文档上传 | 侵权投诉 | 手机版
新浪认证  诚信网站  绿色网站  可信网站   非经营性网站备案
本站所有资源均来自互联网,本站只负责收集和整理,均不承担任何法律责任,如有侵权等其它行为请联系我们.
文档下载 Copyright 2013 doc.wendoc.com All Rights Reserved.  email
返回顶部