汇总如下:
1.情景分为:运算情景,用户情景和实体情景; 2.运算情景为具体的硬件,网络设备;用户情景为用户的偏好行为以及个人档案;实体情景为具体的环境,温度湿度等; 3.模糊理论也就是最终获取一个概率值,而不是传统的是否二分法; 4.集合A和集合B,那么A和B的匹配度为(A交B/A并B); 5.对中文文章的文本处理包括:切词,词语重组,词过滤,同意转换和构建关键词; 6.词重组具体:"中华人民共和国"切词为“中华”和“人民共和国”那么进行重组为“中华人民共和国”; 7.同意转换为“中华人民共和国”等同于"中国"; 8.构建关键词为计算tf-idf 9.词的热度公式为:(Af[i]-Af[min])/(Af[max]-Af[min]),其中f为某词点击次数; 10.需要基于知识库构建词汇延伸关系,如中国出现的时候都会出现美国,那么中国这个词的延伸词为美国; 11.基于词汇延伸关系构建定制模糊规则; 12.构建用户场景的时候要考虑偏好的时间性,可以通过构建环来实现,如[0,10,0]当某偏好的值达到10的时候清零;
几种重要的点:
1.同义词知识库; 2.词汇延伸知识库; 3.用户喜好的时间性; 4.构建模糊规则; 5.关联关系;
更多详情参见附件