php 中文分词类库 简易版

现在 中文分词现在都是用 scws 或者 sphinx 这种来分词了
而我只是想分个文章或者小标题 想找个简单的分词就一直找不到; 无奈之下找到一个不出名的类库 自己稍加修改 就做好了分词;

现在进入正文;

git下载类库包

下载完成后放在自己的类库中备用;注意要从lib目录中拿出来

现在来到控制器加载个方法

 /**
     * 关键字提取方法
     *
     * @param $title string
     *         进行分词的标题
     * @param $content string
     *         进行分词的内容
     * @return array 得到的关键词数组
     */
    public static function getKeywords($title = "", $content = "") {
        if (empty ( $title )) {
            return array ();
        }
        if (empty ( $content )) {
            return array ();
        }
        $data = $title . $title . $title . $title; // 为了增加title的权重,这里连接4次


        $pa=new \biz\count\phpanalysis();  //实例化 


        $pa->LoadDict ();

        $pa->SetSource ( $data );

        $pa->StartAnalysis ( true );

        $tags = $pa->GetFinallyKeywords ( 2 ); // 获取文章中的3个关键字,想要几个就写几个就行


        return $tagsArr;//返回关键字数组
    }

就直接调用此方法就行了;

  $FLabelRe=$this->getKeywords($title,$content); //直接调用方法 就返回数组了

看下效果

$title="金融危机重创东南亚,泰国、马来西亚、菲律宾、印度尼西亚等国损失惨重";

这里写图片描述

备注:要是没有调用到词典是会报错或者分词不准哦;要把路径填清楚;实例化成功后进LoadDict方法去var_dump一下字典就可以知道有没有应用成功了 只要路径都是正确的就可以用了

猜你喜欢

转载自blog.csdn.net/qq_41642932/article/details/82287615
今日推荐