关于MapReduce二次排序的一点解答

上一篇博客说明了怎么自定义Key,而且用了二次排序的例子来做测试,但没有详细的说明二次排序,这一篇说详细的说明二次排序,为了说明曾经一个思想的误区,特地做了一个3个字段的二次排序来说明。后面称其为“三次排序”。 测试数据: a1,b2,c5 a4,b1,c3 a1,b2,c4 a2,b2,c4 a2,b1,c4 a4,b1,c2 测试目的:输出以下结果首先根据第一个自段排序,如果第一个字段排好后再根据第二个字段的升序排序最后在根据第三个字段进行排序,得到以下结果。 a1 b2,c4 a1 b2
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

KVM的qemu-kvm使用

KVM: kvm,x86支持硬件辅助虚拟化技术(hvm) grep -E "(vmx|svm)" /proc/cpuinfo [root@dmsag ~]# ll /dev/kvm crw-rw-rw- 1 root kvm 10, 232 Dec 4 19:14 /dev/kvm 查看内核模块信息 modinfo kvm modinfo kvm-intel 装载模块并查看(装载kvm模块就会顺带装载kvm-intel模块) [root@dmsag ~]# modprobe kvm [root
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

php防范

针对 PHP 的网站主要存在下面几种攻击方式: 1、命令注入(Command Injection) 2、eval 注入(Eval Injection) 3、客户端脚本攻击(Script Insertion) 4、跨网站脚本攻击(Cross Site Scripting, XSS) 5、SQL 注入攻击(SQL injection) 6、跨网站请求伪造攻击(Cross Site Request Forgeries, CSRF) 7、Session 会话劫持(Session Hijacking)
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

图片自适应容器大小

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>img auto</title> <style> body { position: relative; } .parent { position: absolute; width: 100%;
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

python中matplotlib画图

参考 https://blog.csdn.net/u010358304/article/details/78906768 https://www.cnblogs.com/onemorepoint/p/7482644.html https://www.cnblogs.com/onemorepoint/p/7481643.html
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

需求分析与用户体验分析

我们是第十一号团队 报告制作人 左非 团队担任职务 软件工程师 于奇炜 团队担任职务产品经理 团队简介软件工程师 张博文 项目经理 冷志明 软件工程师 张炳宏 软件工程师 左非 软件工程师 张翼龙 软件测试工程师 姜海涵 Ui 张泽 产品经理 于奇炜 我们分析的软件是: 必应输入法 对比软件: 搜狗输入法 问卷调研对象: 大学生 软件功能的分析 必应输入法: “必应输入法”保留了英库输入法的自然语言处理、中文计算、搜索引擎、机器翻译等功能。同时,引入应用开放平台,用户可以管理、删除已安装的应用
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

js中this的绑定规则及优先级

一. this绑定规则 函数调用位置决定了this的绑定对象,必须找到正确的调用位置判断需要应用下面四条规则中的哪一条。 1.1 默认绑定 看下面代码: function foo() { console.log(this.a); } var a = 1; foo(); // 2 调用foo的时候,this应用了默认绑定,this指向了全局对象,但是在严格模式下,那么全局对象将无法进行默认绑定,因此this会绑定到undefined function foo() { 'use
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

php自定义函数及内部函数----字符串处理函数

一、统计字符串 (1)strlen() 统计字符串长度 函数返回值为整形,表示字符串长度。若返回值为0,表示该字符串为空。该函数对待一个UTF8的中文字符,处理为3个字节长度。 echo strlen("xiaolin!");// 输出:8 echo strlen("小林!"); // 输出:7 (2)mb_strlen() 统计中文字符串的长度 mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

《Pro SQL Server Internals》翻译之索引

本文选自《Pro SQL Server Internals》 作者: Dmitri Korotkevitch 出版社: Apress 出版年: 2016-12-29 页数: 804 作者简介:Dmitri Korotkevitchis是微软SQL Server MVP和微软认证大师。作为应用程序和数据库开发人员、数据库管理员和数据库架构师,他具有多年使用SQL Server的经验。他专门从事OLTP系统在高负载下的设计、开发和性能调优。Dmitri经常在各种Microsoft和SQL PASS
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

python12.5作业

6.定义一个字符串"python的创始人是Guido",试分别打印出"Guido","odiuG", "ph的人uo" s='python的创始人是Guido' l=len(s) print(s[11:16]) print(s[15:10:-1]) print(s[0]+s[3]+s[6]+s[9]+s[12]+s[15]) 7.有字符串"你"和"最帅",如何得到字符串"你最帅",又如何得到字符串"你最帅最帅最帅" a='你' b='最帅' print(a+b) print(a+b+b*2)
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

tensorflow错别字检测

引言 当前无论是学术界还是工业界,深度学习都受到极大的追捧,尤其是在Google开源深度学习平台TensorFlow之后,更是给深度学习火上浇油。目前在开源社区Github上所有开源项目中,TensorFlow最为活跃,从推出到现在,经历了几个版本的演进,可以说能够灵活高效地解决大量实际问题。本文主要尝试阐述TensorFlow在自然语言处理(NLP)领域的简单应用,让大家伙儿更加感性地认识TensorFlow。 说到NLP,其实我对它并不是很熟悉,之前也未曾有过NLP的相关经验,本文是我最近
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

spring boot入门指南(来自官网入门指南)

1. spring boot 可以使你通过很小的前期配置尽可能快的启动和运行项目,spring boot用自己的观点来创建产品已有的应用 2. 启动: 使用spring boot创建一个应用: 本指南提供了spring boot如何帮助你加快和促进应用的开发。和你看过的其他启动指南一样,在本指南中你会看到更多spring boot的使用案例。 意味着给你一个更快的spring boot体验。如果你想要创建自己的spring boot项目,访问Spring Initializr,填写你的详细项目
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

spring boot参考文档——目录

sprint boot操作指南 ------------------------- 作者: Phillip Webb, Dave Syer, Josh Long, Stéphane Nicoll, Rob Winch, Andy Wilkinson, Marcel Overdijk, Christian Dupuis, Sébastien Deleuze, Michael Simons, Vedran Pavić, Jay Bryant, Madhura Bhave 2.0.3.RELEASE
分类: 其他 发布时间: 12-05 23:34 阅读次数: 0

spring boot参考文档——PartI和PartII

Part I. Spring Boot参考文档 本小节是对Spring Boot参考文档的概述. 是文档其余部分的映射. 1. 关于本参考文档 本参考文档支持的文件格式有: HTML PDF EPUB 最新版本路径:docs.spring.io/spring-boot/docs/current/reference. 本文档免费,并且没有任何使用限制。 2. 获取帮助 如果你在使用spring boot时遇到困难,可以通过以下方式获取帮助: 参考How-to文档。它提供了大多数常见问题的解决方案
分类: 其他 发布时间: 12-05 23:33 阅读次数: 0

文本纠错

假设有这么一个场景,医生开处方的时候,可能写错药品和疾病名称,需要程序自动化纠错 例如:曲米新乳膏和二甲双瓜和双黄连 曲米新乳膏 ==> 曲咪新乳膏 二甲双瓜 ==> 二甲双胍 怎么做呢? 直觉告诉我们,应该有一个数据源,包含所有的药品疾病名称。 1、数据抓取 寻医问药 http://www.xywy.com/ 丁香园 http://www.dxy.cn/ 好大夫 http://www.haodf.com/yaopin/ 涉及知识: 网络爬虫 http协议 html 正则 网络代理 字符编码
分类: 其他 发布时间: 12-05 23:33 阅读次数: 0

文本纠错,BK树

从编辑距离、BK树到文本纠错 搜索引擎里有一个很重要的话题,就是文本纠错,主要有两种做法,一是从词典纠错,一是分析用户搜索日志,今天我们探讨使用基于词典的方式纠错,核心思想就是基于编辑距离,使用BK树。下面我们来逐一探讨: 编辑距离 1965年,俄国科学家Vladimir Levenshtein给字符串相似度做出了一个明确的定义叫做Levenshtein距离,我们通常叫它“编辑距离”。 字符串A到B的编辑距离是指,只用插入、删除和替换三种操作,最少需要多少步可以把A变成B。例如,从FAME到G
分类: 其他 发布时间: 12-05 23:33 阅读次数: 0

文本纠错,BK树,详细

BK树或者称为Burkhard-Keller树,是一种基于树的数据结构,被设计于快速查找近似字符串匹配,比方说拼写纠错,或模糊查找,当搜索”aeek”时能返回”seek”和”peek”。 本文首先剖析了基本原理,并在后面给出了Java源码实现。 BK树在1973年由Burkhard和Keller第一次提出,论文在这《Some approaches to best match file searching》。这是网上唯一的ACM存档,需要订阅。更细节的内容,可以阅读这篇论文《Fast Appro
分类: 其他 发布时间: 12-05 23:33 阅读次数: 0

spring boot参考文档——Part III

Part III. 使用Spring Boot 本节将深入讲述使用spring boot的更多细节。包括项目构建系统,自动配置,和如何运行应用等主题。同样包含一些spring boot的练习。 虽然spring boot没有什么特殊的地方,但是这里还是做了一些介绍,跟着学习,可以使你的开发过程更容易一些。 如果你是spring boot的新手,进入本节之前你应该先阅读启动指南。 13. 项目构建系统 强烈建议选择一个支持依赖管理并且可以发布到maven中心仓库的工具。我们推荐maven和gra
分类: 其他 发布时间: 12-05 23:32 阅读次数: 0

编辑距离,BK树

搜索引擎里有一个很重要的话题,就是文本纠错,主要有两种做法,一是从词典纠错,一是分析用户搜索日志,今天我们探讨使用基于词典的方式纠错,核心思想就是基于编辑距离,使用BK树。下面我们来逐一探讨: 编辑距离 1965年,俄国科学家Vladimir Levenshtein给字符串相似度做出了一个明确的定义叫做Levenshtein距离,我们通常叫它“编辑距离”。 字符串A到B的编辑距离是指,只用插入、删除和替换三种操作,最少需要多少步可以把A变成B。例如,从FAME到GATE需要两步(两次替换),从
分类: 其他 发布时间: 12-05 23:32 阅读次数: 0

nmt

GitHub 链接:https://github.com/tensorflow/nmt
分类: 其他 发布时间: 12-05 23:32 阅读次数: 0