vicword version 1.4, PHP sous thésaurus chinois

VicWord un mot de php pur

Mise à jour majeure:
    1. Ajouter un chemin de thésaurus par défaut
    2. thésaurus n'existe pas de faux retours, au lieu de lancer une exception.

Code Cloud Adresse: https://gitee.com/jitog/phpfenci
GitHub:  https://github.com/lizhichao/VicWord

mot DESCRIPTION
    contenant trois types Segmentation
    getWord de longueur de segmentation de priorité. La plus rapide
    segmentation fine à grains fins getShortWord. Un peu de vitesse que la plupart
    pause getAutoWord automatiquement. Les meilleurs

trois types de résultats de la comparaison de mots

    $fc = new VicWord('igb');
    $arr = $fc->getWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒');
    //北京大学|生喝|进口|红酒|,|在|北京大学|生活区|喝|进口|红酒
    //$arr 是一个数组 每个单元的结构[词语,词语位置,词性,这个词语是否包含在词典中] 这里只值列出了词语

    $arr =  $fc->getShortWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒');
    //北京|大学|生喝|进口|红酒|,|在|北京|大学|生活|区喝|进口|红酒

    $arr = $fc->getAutoWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒');
    //北京|大学生|喝|进口|红酒|,|在|北京大学|生活区|喝|进口|红酒

    //对比
    //qq的分词 http://nlp.qq.com/semantic.cgi#page2 
    //百度的分词 http://ai.baidu.com/tech/nlp/lexical

vitesse mot
    machine à Ali nuage Intel (R) Xeon (R) Platinum 8163 la CPU @ 2.50GHz
    getWord mots 140W par seconde
    mot getShortWord 138w par seconde
    parole de getAutoWord par seconde
    période d'essai de 5000 mots copie texte texte de Baidu Encyclopédie

Je suppose que tu aimes

Origine www.oschina.net/news/114652/vicword-1-4-released
conseillé
Classement