SCWS中文分词,安装说明(以:Win32环境、utf8字符集为例)

SCWS官方网站:http://www.xunsearch.com/scws/

1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。
    目前支持 PHP-5.2.x 和 PHP-5.3.x 系列,下载地址分别为:
    php-5.2.x(44KB/VC6/ZTS): http://www.xunsearch.com/scws/down/php-5.2.x/php_scws.dll
    php-5.3.x(44KB/VC6/ZTS): http://www.xunsearch.com/scws/down/php-5.3.x_vc6/php_scws.dll
    将下载后的  php_scws.dll 放到 php 安装目录的extensions/ 目录中去(通常为:X:/php/extensions/ 或 X:/php/ext/)。

2. 创建一个本地目录,用于存放词典文件和规则集文件,比如:D:/Program Files/AppServ/scws/etc  或 C:/program files/scws/etc

3. 从 scws 主页上下载词典文件
    词典系列:http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 (简体中文)
    解压后将 dict.utf8.xdb 放到上述(第 2 步)目录中

4. 从 scws 主页上下载规则集文件
    规则集文件压缩包:http://www.xunsearch.com/scws/down/rules.tgz
    解压后有三个文件分别为 rules.ini  rules.utf8.ini rules_cht.utf8.ini
    将其中一个 rules.utf8.ini 文件拷到(第 2 步)目录中

5. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
    在 php.ini 的末尾加入以下几行:

[scws]
; SCWS中文分词模块
; 1. 注意请检查 php.ini 中原来的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
;    再把 php_scws.dll 指定为绝对路径。
; 2. scws.default.fpath = (第 2 步)目录
extension = php_scws.dll
scws.default.charset = utf8
scws.default.fpath = "D:/Program Files/AppServ/scws/etc"

6. 重启 web 服务器即可完成。

原文地址:https://www.cnblogs.com/martinzhang/p/3209696.html