Centos中文分词SCWS安装和使用 PHP使用SCWS进行中文分词

前言
开发的程序需要通过搜索出所需要的信息,因用户搜索的关键字过于模糊,所以采用分词进行搜索 。
安装步骤 1.下载源码
cd /usr/local/srcwget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2tar xvjf scws-1.2.3.tar.bz2cd scws-1.2.3./configure --prefix=/usr/local/scwsmake && make install
2.检查是否安装成功
/usr/local/scws/bin/scws -h
3.下载通用词典
cd /usr/local/scws/etcwget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2tar xvjf scws-dict-chs-gbk.tar.bz2tar xvjf scws-dict-chs-utf8.tar.bz2
【Centos中文分词SCWS安装和使用 PHP使用SCWS进行中文分词】4.安装 php 扩展
注意:/www//php/73/bin/ 要看清楚自己PHP安装的目录
cd ./scws-1.2.3 /phpext/locate phpize/www/server/php/73/bin/phpize./configure --with-php-config=/www/server/php/73/bin/php-config --with-scws=/usr/local/scwsmake && make install
5.在 php.ini 中加入以下几行
注意:需要重启服务器php.ini才会生效,成功后在中可以查询到scws
extension = scws.soscws.default.charset = utf8scws.default.fpath = /usr/local/scws/etc
6.测试代码
// 输出结果//Array//(//[0] => Array//(//[word] => 代码//[times] => 1//[weight] => 4.8200001716614//[attr] => n//)////[1] => Array//(//[word] => 我爱//[times] => 1//[weight] => 4.5900001525879//[attr] => n//)////)
注意
本人在测试过程中出现了:in . File(/usr/local/scws/etc/dict.utf8.xdb) is notthepath(s) 这个错误提示 。由于我是宝塔面板安装的,只需要在相应的网站目录,勾选掉防跨站攻击()即可 。