大数据/数仓面试灵魂30问(转)
1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问)2.如何建设数据中台?可简单说下理解与思路3.数据仓库、数据中台、数据湖的理解4.传统数仓的程度(建模工具、ETL工具、BI报表工具、调度系统)5.传统数仓和大数据数仓的异同?有哪些大的变化?6.印象最深刻的项目?为什么?亮点与优势?7.数仓最重要的是什么?8.实时数仓做过吗?采用什么架构?lambda有哪些优缺点?9.如何看待kappa架构?iota架构呢?10.责任心?沟通能力?团队协作?数据思维?_大数据数仓面试题
SQL 分组计算 topN
首先安利这款免费在线 SQL 运行平台 sql fiddle:建表:create table score ( name varchar(20), subject varchar(20), score int );-- 2.插入测试数据 insert into score(name,subject,score) values(张三,语文,98);insert into score(name,subject,score) values(张三,数学,80);inse_sql 求topn
Excel 函数之 vlookup
vlookup 的功能为匹配查找。VLOOKUP的公式:“=VLOOKUP(查找值,数据表,序列数,匹配条件[0,1])”通俗地讲,就是4个问题,“拿什么匹配”、“字典是那张表”、“字典中的第几列”、“精确查找0还是模糊查找1”。在单元格中输入“=VLOOKUP(”,然后用鼠标拖动选择查找值所在的单元格,接着用鼠标选取查找范围单元格,最后输入第三和第四个参数。输入时有两个小技巧,第一,先点击一个单元格,按“Ctrl +Shift + ↓”可以快速选中该单元格及之后的同一列的数据,按“Ctrl +Sh_vlookup函数的使用方法两个表
几种常见的概率统计谬误
转载自:输出ING一、幸存者偏差描述关注于眼前那些经历了某些过程而幸存下来的人或物,却忽视了不在视线范围内的未幸存下来的人或物。举例二战中美国军方想加强飞机的防护,从而降低被敌军击落的几率。根据返航回来的飞机,可以看到弹孔主要分布于机翼和飞机尾部,而驾驶舱、发动机和油箱的弹孔则非常稀少。因为机翼和飞机尾部弹孔更多,军方认为应该加强这两个部位的防护。但给美国海军提供智囊顾问服务的沃德教授却提出了加强机身防护的建议,他认为:此次统计的样本,仅包含没有因敌火射击而坠毁并安全返航的轰炸机。
SQL再谈分组topN
题目Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 85000 | 1 || 2 | Henry | 80000 |
SQL 分组排序的窗口函数 rank, dense_rank, row_number
建表create table score ( name varchar(20), subject varchar(20), score int );-- 2.插入测试数据 insert into score(name,subject,score) values(张三,语文,98);insert into score(name,subject,score) values(张三,数学,80);insert into score(name,subject,score) v_分组百分比排名 sql 窗口函数
mysql 实现 rank, dense_rank
编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。+----+-------+| Id | Score |+----+-------+| 1 | 3.50 || 2 | 3.65 || 3 | 4.00 || 4 | 3.85 || 5 | 4.00 || 6 | 3.65 |+----+-------+例如,根据上述给定的 Scor_mysql怎么实现dense rank
华为手机删除用户凭据(用于 WLAN)
一时激动在手机上安装了 Fiddler 安全证书,然后想删掉,发现居然找不到删除选项,真实尴尬!先找到对应的证书:设置 →\\to→ 安全和隐私 →\\to→ 更多安全设置 →\\to→ 加密和凭据 →\\to→ 用户凭据返回上一步,点击 “删除所有凭据”,不过放心,系统自带的证书是不会受影响的输入密码后,用户凭据已经清空,系统证书还在..._使用wlan的凭据
Thumbs.ms\com1.{d3e34b21-9d75-101a-8c3d-00aa001a1652}
市面上流通的插有SD卡的播放器产品,通常都有做加密:明明空间用了大半,打开文件夹却不显示现原形用 winrar 打开U盘路径里面原来是有东西的!而且主要内容在这么一个奇怪的路径下:E:\\Thumbs.ms\\com1.{d3e34b21-9d75-101a-8c3d-00aa001a1652}\\ã..\\LastF第一步,取消隐藏cmd 到 u 盘,执行attrib -s -r -h Thumbs.ms第二步,改文件名在 winrar 中改成正常路径,去掉非法字符接下来_com1.{d3e34b21-9d75-101a-8c3d-00aa001a1652}怎么打开
pandas 筛选指定时间范围的数据
time_start = datetime(2020, 7, 23, 18) # 以 datetime 为索引,读取数据df = pd.read_csv(result_file0, index_col = datetime)# 将索引类型改成 DatetimeIndexdf.index = pd.DatetimeIndex(df.index)# 根据索引筛选df = df[df.index > time_start]..._pandas 读取指定日期时间的行数据
满K叉树的叶子节点数有什么特点?
满 K 叉树中的节点要么是叶子结点,要么有 kkk 个子节点满 K 叉树的叶子结点数 mmm 满足:(m−1)%(k−1)=0(m-1) \\% (k-1) = 0(m−1)%(k−1)=0以3叉树为例:容易观察:假设初始状态如蓝框所示,每当增加新的叶子节点,必然需要把一个叶子结点变成中间节点,再增加新的 kkk 个叶子结点,所以算下来新增了 k−1k-1k−1 个叶子结点。所以,满 kkk 叉树的叶子结点数 mmm 必然是如下等差数列的一项:k,2k−1,3k−2,…,k+n(k−1)._满k叉树
今日推荐
周排行