搜索引擎elastic的一次伟大的尝试

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/linfujian1999/article/details/82699067

接触elastic,是因为它恰好和需求匹配。

我们在六月份的时候决定要做一款伟大的产品,这款产品是基于东哥几年来呕心沥血搜集来的各种基因相关数据库资源以及nlp训练出来的数据。

一次公交车的偶遇东哥知道了我在寻求好的机会,问我要不要加入,此刻他已经有了创业的打算。

我接到这个需求,前期的框架和安全登陆模块恰好和我去年暑假酷热难耐时期做的电商平台相似,决定复用(可以参照我的技术博客关于平台搭建的博文)。

白天工作,闲暇之余来构思和创作。

架构复用了之前的Springmvc,用户登陆模块Springsecurity,前端jsp+jquery (抱歉react和angular再去熟悉太花时间),数据库mysql。

前期只做了变异模块,mysql还能撑得住。

需求变得越来越和关系型数据库不能和平共处了:数据某些字段为文章摘要,动则几百个单词,匹配的字段要高亮展示于页面,要求在动则千万的数据中快速匹配并返回…

伟哥的一句话让我和elastic结缘……

elastic存储数据是将数据索引的过程,当你查找这些数据时实则是通过建立的索引快速匹配到的,就像翻字典,通过检索数据的规律快速定位;高亮是elastic的另一大特色,通过highlight方法(高亮匹配的字段,高亮字段前后截取的size,高亮的格式等)便可轻松高亮。

边使用边学习,比如返回大数据集的scroll和scan,都是在使用过程中现有技术无法满足才尝试了解和使用的。

扫描二维码关注公众号,回复: 3815083 查看本文章

问题仍有很多,仍在探索的路上……

目前varpaper 已经升级第二版,除了之前的变异模块,新增了基因、疾病和药物模块。

目前已有大公司表达合作意愿。

varpaper是一款通过人工智能nlp训练数据得到的可以通过输入变异、基因、疾病及药物快速定位相关文献的产品,用户关键字及变种可在文章摘要及正文高亮,帮助基因疾病分析人员快速找到相关国内外研究资料,提高他们的工作效率。

试用地址:varpaper.com:8080/webes/login

一直在路上…

猜你喜欢

转载自blog.csdn.net/linfujian1999/article/details/82699067