推荐阅读啃饼随笔的《玩聚网的案例分析》

郑昀 201012

    很少转载其他人的博文,但此位来自于QQ阅读团队的“啃饼随笔”博客,一直在撰写AI、文本挖掘、文本分类以及一些方法论方面的心得体会,尤其是本月初在玩聚网被连续关闭(第一财经周刊用封面故事《保证书的世界》报道了此事)(我也荣幸地成为了“北京开关厂厂长”)之后,啃饼博客针对玩聚网写了案例分析,把玩聚网创建以来的技术和产品路线做了一个回顾,也算是为玩聚网支持者和我们做了一个精彩点评。下面为他的全文(原文链接):

+++++++++++++++++++++++++++++++++

啃饼 2010年12月02日

下面是玩聚网自成立以来推出的各种产品,以及和它类似的产品。先大概看看,然后我再说。

产品名(起始年份):描述(涉及的技术点)

热点自动发现:文本相似性计算、层次聚类、特征向量空间等

  • 热点聚合(2007.1):国内主流博客服务提供商(热点自动发现)
  • 热点聚合(2007.4):草根评论自动聚合(热点自动发现)
  • 热点聚合(2007.7):草根图片自动聚合(热点自动发现)
  • 热点聚合(2007.8):国内主流论坛(热点自动发现)
  • 热点聚合(2007.9):国内主流科技新闻媒体(热点自动发现)
  • 宝聚-股市风向标(2007.11):股票(智能语义聚合应用框架垂直应用)
  • 热点聚合(2007.12):关联视频自动聚合(热点自动发现)

相关(相似)产品:

  • digg(2004.11):社会化书签(集体智慧)
  • techmeme(2005.9):追踪科技类热门文章(a_list、反向链接分析)
  • google新闻(2006.1):个性化新闻聚合(协同过滤)
  • 百度新闻(2007.1):新闻分类聚合(文本相似性、文本分类)
  • 豆瓣九点 (2007.1):社会化阅读社区(优质博客源)
  • 抓虾“好看”(2007.4):热文(自动分类)
产品名(起始年份):描述(涉及的技术点)
  • 玩聚SD(2008.5):社会化对话(a_list、智能语义聚合应用框架垂直应用)
  • 玩聚SR(2008.12):基于twiter GReader delicious等的社会化文章推荐(a_list、mashup、memeTracker、Rank、语义关联技术)
  • 玩聚SRBacks(2009.1):聚合评论和分享(blog插件)
  • 玩聚Liked(2009.2):基于FriendFeed API的热门喜欢榜单(memeTracker、Rank)
  • 玩聚RT(2009.2):基于Twitter API的热门锐推榜单(memeTracker、Rank)
  • 玩聚PP(2009.9):基于Twitpic Flickr的热门图片榜单(memeTracker、Rank)
  • 玩聚HOT(2009.12):基于新浪微博的大事件监测(搜索关键词、memeTracker、Rank)
  • 微博锐推榜(2010.9):基于新浪微博的热门锐推榜单(memeTracker、Rank)

相关(相似)产品:

  • stumbleupon(2001):社交化网页推荐引擎(浏览器插件)
  • FriendFeed(2007.11):feed流聚合(lifestream)
  • Tweetmeme():基于twitter追踪tweet热门内容(memeTracker)
  • RssMeme():基于GReader shared items追踪rss热门内容(memeTracker)

    玩聚网是利用语义挖掘技术追踪互联网热点的阅读类网站,最早是做新闻、博客和论坛的热点追踪,产品逻辑上类似于国外的techmeme,但是技术上使用了语义挖掘,不同于techmeme的反向链接分析。之所以借重于语义挖掘这种高难度技巧,郑昀解释说是因为国内的博客写作与国外不同,国内的博客在数量和质量上表现不稳定,并且不习惯在博客间使用链接引用方式。

    这个时期做出来的产品有些像是技术驱动的结果,重点是在检测一种新方法的可行性。推出的产品并没有太大的反响,但是却积累了很丰富的经验,引发了大量的思考:关于国内外现状的比较、关于新媒体的思考、关于阅读最细致最底层的思考,甚至关于人性的思考。

    基于那些充分的思考,玩聚SD,这个社会化对话系统上线了,运用了成熟的智能语义聚合应用框架。郑昀是这样描述玩聚SD的:Social Dialogue就是利用国内优秀的IT、互联网、电信的博客或媒体作为过滤器,他们在博客上的互相引用和讨论,被玩聚SD捕获到。因为这些博客关注的基本上保持一贯的水准,他们之间的社会性对话,也就是就某一个热门话题展开的讨论,往往最及时地反映业界热点,时间差往往不超过一小时。玩聚SD就是负责实时追踪并展示这些对话,通过反向链接计算,通过文本相似计算。

    玩聚SD并没有获得更大的关注,分析原因,可能有以下几点:

  • 1、收集的数据还不够多,过于小众,热点的更新比较慢;
  • 2、入口问题,不能用rss订阅,就无法满足多数人的使用习惯,包括那些博客们;
  • 3、SD的UI也不算好,读起来有点乱,可能内容是精彩的,但是没耐心看下去;

    SD刚出来的时候还是有不少bloger关注的,但可能也只限于一个很小的圈子,这个圈子之外的人不能完全理解这种东西。

    玩聚SR的成功是个意外,郑昀如是说:我们最初并没有想到SR会受到大家的肯定。这实际上是一款技术需求最低的产品,只花了几天就做好了。玩聚SR是一个追踪各种社会化媒体,实时发现IT人都在分享和推荐什么的工具。玩聚SR使用了一些简单的规则和算法,似乎并没有很重的语义挖掘技术蕴藏其中。玩聚SR的成功,除了依赖玩聚本身的技术积累,很大的一个原因是使用了google reader分享和twitter的数据,这两个数据源相比SD的博客有更大的受众,而且它部分解决了用户的真实需求:信息爆炸。玩聚SR很好的抓住了一个趋势,可谓是在一个恰当的时机做了正确的事情。

    玩聚SR的成功原因可以总结以下几点:

  • 1、采用google reader分享和twitter这两个优质数据源,有更多的受众;
  • 2、采用热文列表的简单表现,容易被大众用户接受;
  • 3、入口更丰富,支持rss订阅和微博订阅;
  • 4、及时跟进用户反馈,推出SRBacks、SRCBacks等插件应用。

    玩聚SR的成功估计让郑昀意识到了mashup的价值,玩聚之后的很多尝试都借重于mashup各种数据源:玩聚Liked使用了FriendFeed的数据;玩聚RT使用了twitter的数据;玩聚PP使用了twitpic和flickr的数据;玩聚HOT和微博锐推榜使用了新浪微博的数据。这些应用都是比较简单的,语义挖掘在这里只是一个辅助的角色。

    玩聚后期的成功是恰当的使用了开放数据的缘故,但这也正是它最大的软肋,缺少自有数据的支撑,处在一个非常复杂的互联网环境,这就决定了当前的玩聚是走不了太远的。但是,这又怎么样,作为语义应用框架的提出者和实践者,郑昀走过的路可以帮助无数的后来者清除羁绊。动嘴不如动手,在当前浮躁气氛浓烈的互联网大环境下,能够做到这点太不容易了。

    玩聚的案例还有一些实际的指导作用。总结了以下几点:

  • 1、不要轻易改变用户的使用习惯,那会死的很惨,除非你创造了一个革命性的产品;
  • 2、无论使用多么复杂的技术,面向用户的功能一定要力求简单易理解,好的技术应该致力于让这种简单更加稳定;
  • 3、语义技术在一些领域大有作为,有复杂的玩法,同时也有简单的玩法,决定于你想要的。

   最后,很杯具的,玩聚已经由于众所周知的原因,只能FQ到twitter关注@rtmeme 去膜拜一下了。那可是个很聪明的机器人哦:)

此日志来自QQ邮箱!

++++++++++++++++++++++++

全文完。

欢迎订阅啃饼随笔,由于他的QZone空间不好订阅,所以我一般都是订阅他的新浪博客:http://blog.sina.com.cn/kenbinzhang RSS:http://blog.sina.com.cn/rss/1736173915.xml 。

赠送图片:

悠闲

我的推特流:

1、

传说中,某些公司都是几十辆几十辆奥迪的买,不知道替谁采购的。这也是一条路:北京市公务机关的公务车五年内是不能再增加指标了,但我公司可以买好上好牌照“借给”公务员们开啊。

2、

那些北京4S店的销售们这个春节会过得很滋润,估计会有大量销售拿到年终奖后辞职,反正开春之后,面对大大萎缩的销售状况,还是早点逃离得好。

3、

这制片助理当的:http://is.gd/jhOfc 背景介绍:《让子弹飞》制片助理赵铭友情客串。

4、

记者讲述商业史时很习惯把领导者的行为随机化或者幼稚化。举例:『凡客副总裁杨芳在小区偶遇正在打扫的李阿姨,随口问了一句:“今年夏天会花多少钱买件T恤?”李阿姨说,“30以下我会买”。陈年得知答案后,就给凡客的印花T定价29元。』再譬如:“引爆点就是凡客的帆布鞋产品。帆布鞋的思路来源于陈年的小侄女,她是帆布鞋粉丝,五年前,她就永远是一双帆布鞋,而且很精心的清洗它。陈年大为触动,试试帆布鞋。”

5、

寻找LBS+各种Map API+SNS技术高手(Location:北京),请帮忙推荐。

6、

丁磊终于赚钱了:2010年上半年,出栏一头200斤左右的生猪,亏损大约在200元左右。而风起云涌的通胀,让近两个月,每头猪赢利达到300元左右——据经济观察报报道。

附送三个小萝莉:

http://ww1.sinaimg.cn/large/61e44b02jw6dclfnzwqp1j.jpg

原文地址:https://www.cnblogs.com/zhengyun_ustc/p/ju690_kenbing.html