转自水木NLP,duckyaya版主总结的关于文本分类的若干资源。

发信人: duckyaya (逃亡), 信区: NLP
标  题: Re: 提供开源中文新闻文本分类语料库
发信站: 水木社区 (Sun Sep 12 00:35:17 2010), 站内

我以前也整理过一些

http://www.scholarpedia.org/article/Text_categorization
涉及到文本分类的基本概念,存在的问题以及方向。

http://www.cs.technion.ac.il/~gabr/resources/atc/atcbib.html
涉及到文本分类的历年文章

http://techtc.cs.technion.ac.il/
用于文本分类的ODP数据集

http://web.ist.utl.pt/~acardoso/datasets/
经过处理的单类别文本分类数据集

http://www.cs.umass.edu/~mccallum/code-data.html

http://zeddius.spaces.live.com/blog/cns!2916695FA7B7532B!538.entry
其他数据集总结的

很久没做文本分类了,呵呵。
【 在 finallyliuyu (原地转圈的驴子) 的大作中提到: 】
: 下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html

--
I'm overboard, And I need your love
Pull me up, I can't swim on my own
It's too much
Feels like I'm drowning without your love
So throw yourself out to me, my life saver
原文地址:https://www.cnblogs.com/finallyliuyu/p/1824354.html