备战秋招——算法与数据结构(13)

1. 1-2n的数存储在空间为n的数组中,找出出现两次的数字,时间复杂度O(n),空间复杂度O(1)

/*
奇数零次 偶数零次 0
奇数 一次 偶数 零次 -1
奇数 两次 偶数 零次 -2
奇数 零次 偶数 一次-3
奇数 一次 偶数 一次-4
奇数 两次 偶数 一次-5
奇数 零次 偶数 两次-6
奇数一次 偶数 两次-7
奇数两次 偶数两次-8
*/ 
public class Main {
    
    
 public static void main(String[] args) {
    
    
 int[] nums = {
    
    1, 3, 5, 15, 7, 8, 5, 3, 6, 15};
 findNumber(nums, nums.length);
 print(nums);
 }
 
 public static void findNumber(int[] nums, int length) {
    
    
 for (int i = 0; i < length; ) {
    
    
 if (nums[i] <= 0){
    
    
 i++;
 continue;
 }
 int index = nums[i] / 2;
 boolean isOdd = (nums[i] % 2 == 0) ? false : true;
 switch (nums[index]) {
    
    
 case 0:
 if (isOdd == true) {
    
    
 nums[index] = -1;
 } else {
    
    
 nums[index] = -3;
 }
 break;
 case -1:
 if (isOdd == true) {
    
    
 nums[index] = -2;
 } else {
    
    
 nums[index] = -4;
 }
 break;
 case -2:
 nums[index] = -3;
 break;
 case -3:
 if (isOdd == true) {
    
    
 nums[index] = -4;
 } else {
    
    
 nums[index] = -6;
 }
 break;
 case -4:
 if (isOdd == true) {
    
    
 nums[index] = -5;
 } else {
    
    
 nums[index] = -7;
 }
 break;
 case -5:
 nums[index] = -6;
 break;
 case -6:
  nums[index] = -7;
 break;
 case -7:
 nums[index] = -8;
 break;
 default:
 swap(nums, i, index);
 if (isOdd) {
    
    
 nums[index] = -1;
 } else {
    
    
 nums[index] = -3;
 }
 continue;
 }
 nums[i++]=0;
 }
 }
 public static void swap(int[] nums, int i, int j){
    
    
 int temp =nums[i];
 nums[i]=nums[j];
 nums[j]=temp;
 }
 
 public static void print(int[] nums) {
    
    
 for (int i = 0; i < nums.length; i++) {
    
    
 if (nums[i] == -2) {
    
    
 System.out.println(i * 2 + 1);
 } else if (nums[i] == -6) {
    
    
 System.out.println(i * 2);
 } else if (nums[i] == -8) {
    
    
 System.out.println(i * 2);
 System.out.println(i * 2 + 1);
 }
 }
 }
}

2. 长度为1的线段,随机在其上选择两点,将线段分为三段,问这3段能组成一个三角形的概率是多少?

可行域是
x+y+z=1,0<x,y,z<1
显然,可行域与我的博客一条长度为1的线段,随机剪两刀,求有一根大于0.5的概率问题一样。
要令三段成为一个三角形,必须满足
x+y>z, x+z>y, y+z>x
∣x−y∣<z,∣x−z∣<y,∣y−z∣<x
又x+y+z=1,当x+y=z 时,有z=0.5 z=0.5z=0.5,因此当x,y,z 中有一个大于0.5时,就无法成立一个三角形。
当x−y=z时,将x−y=z代入x+y+z=1,可得x=0.5。因此当x,y,z中有一个大于0.5时,就无法成立一个三角形。
因此解空间刚好与一条长度为1的线段,随机剪两刀,求有一根大于0.5的概率相反。而一条长度为1的线段,随机剪两刀,求有一根大于0.5的概率的概率为0.75。因此这3段能组成一个三角形的概率是多少是1−0.75=0.25。

3. 请解释什么是C10K问题,后来是怎么解决的?

1.C10K问题
互联网还不够普及,用户也不多。一台服务器同时在线100个用户估计在当时已经算是 大型应用了。所以并不存在什么C10K的难题。互联网的爆发期应该是在www网站,浏 览器,雅虎出现后。最早的互联网称之为Web1.0,互联网大部分的使用场景是下载一 个Html页面,用户在浏览器中查看网页上的信息。这个时期也不存在C10K问题。
Web2.0时代到来后就不同了,一方面是普及率大大提高了,用户群体几何倍增长。另 一方面是互联网不再是单纯的浏览万维网网页,逐渐开始进行交互,而且应用程序的逻 辑也变的更复杂,从简单的表单提交,到即时通信和在线实时互动。C10K的问题才体 现出来了。每一个用户都必须与服务器保持TCP连接才能进行实时的数据交互。 Facebook这样的网站同一时间的并发TCP连接可能会过亿。
腾讯QQ也是有C10K问题的,只不过他们是用了UDP这种原始的包交换协议来实现的, 绕开了这个难题。当然过程肯定是痛苦的。如果当时有epoll技术,他们肯定会用TCP。 后来的手机QQ,微信都采用TCP协议。
这时候问题就来了,最初的服务器都是基于进程/线程模型的,新到来一个TCP连接, 就需要分配1个进程(或者线程)。而进程又是操作系统最昂贵的资源,一台机器无法 创建很多进程。如果是C10K就要创建1万个进程,那么操作系统是无法承受的。如果 是采用分布式系统,维持1亿用户在线需要10万台服务器,成本巨大,也只有Facebook, Google,雅虎才有财力购买如此多的服务器。这就是C10K问题的本质。
实际上当时也有异步模式,如:select/poll模型,这些技术都有一定的缺点,如selelct 最大不能超过1024,poll没有限制,但每次收到数据需要遍历每一个连接查看哪个连 接有数据请求。
2. 解决方案
解决这一问题,主要思路有两个:
一个是对于每个连接处理分配一个独立的进程/线程;
另一个思路是用同一进程/线程来同时处理若干连接。

每个进程/线程同时处理多个连接
1.传统思路
最简单的方法是循环挨个处理各个连接,每个连接对应一个 socket,当所有 socket 都 有数据的时候,这种方法是可行的。
但是当应用读取某个 socket 的文件数据不 ready 的时候,整个应用会阻塞在这里等 待该文件句柄,即使别的文件句柄 ready,也无法往下处理。
思路:直接循环处理多个连接。
问题:任一文件句柄的不成功会阻塞住整个应用。

2.select
要解决上面阻塞的问题,思路很简单,如果我在读取文件句柄之前,先查下它的状态, ready 了就进行处理,不 ready 就不进行处理,这不就解决了这个问题了嘛?
于是有了 select 方案。用一个 fd_set 结构体来告诉内核同时监控多个文件句柄,当 其中有文件句柄的状态发生指定变化(例如某句柄由不可用变为可用)或超时,则调用 返回。之后应用可以使用 FD_ISSET 来逐个查看是哪个文件句柄的状态发生了变化。
这样做,小规模的连接问题不大,但当连接数很多(文件句柄个数很多)的时候,逐个 检查状态就很慢了。因此,select 往往存在管理的句柄上限(FD_SETSIZE)。同时, 在使用上,因为只有一个字段记录关注和发生事件,每次调用之前要重新初始化 fd_set 结构体。
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
思路:有连接请求抵达了再检查处理。
问题:句柄上限+重复初始化+逐个排查所有文件句柄状态效率不高。

3.poll
poll 主要解决 select 的前两个问题:通过一个 pollfd 数组向内核传递需要关注的 事件消除文件句柄上限,同时使用不同字段分别标注关注事件和发生事件,来避免重复 初始化。
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
思路:设计新的数据结构提供使用效率。
问题:逐个排查所有文件句柄状态效率不高。

4.epoll
既然逐个排查所有文件句柄状态效率不高,很自然的,如果调用返回的时候只给应用提 供发生了状态变化(很可能是数据 ready)的文件句柄,进行排查的效率不就高多了么。
epoll 采用了这种设计,适用于大规模的应用场景。
实验表明,当文件句柄数目超过 10 之后,epoll 性能将优于 select 和 poll;当文 件句柄数目达到 10K 的时候,epoll 已经超过 select 和 poll 两个数量级。
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
思路:只返回状态变化的文件句柄。
问题:依赖特定平台(Linux)。
因为Linux是互联网企业中使用率最高的操作系统,Epoll就成为C10K killer、高并 发、高性能、异步非阻塞这些技术的代名词了。

5.libevent
由于epoll, kqueue, IOCP每个接口都有自己的特点,程序移植非常困难,于是需要对 这些接口进行封装,以让它们易于使用和移植,其中libevent库就是其中之一。跨平 台,封装底层平台的调用,提供统一的 API,但底层在不同平台上自动选择合适的调用。
按照libevent的官方网站,libevent库提供了以下功能:当一个文件描述符的特定事 件(如可读,可写或出错)发生了,或一个定时事件发生了,libevent就会自动执行 用户指定的回调函数,来处理事件。目前,libevent已支持以下接口/dev/poll, kqueue, event ports, select, poll 和 epoll。Libevent的内部事件机制完全是基于所使用 的接口的。因此libevent非常容易移植,也使它的扩展性非常容易。目前,libevent 已在以下操作系统中编译通过:Linux,BSD,Mac OS X,Solaris和Windows。

另外需要完整版一线互联网大厂面试题以及关于c++ Linux后台服务器开发的一些知识点分享:Linux,Nginx,MySQL,Redis,P2P,K8S,Docker,TCP/IP,协程,DPDK,webrtc,音视频等等视频。
vx关注零声学院公众号领取!

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/lingshengxueyuan/article/details/107824292