企业级大数据处理方案03-数据流程

数据处理过程分为数据挖掘和数据分析,广义上说数据分析泛指整个过程,然而数据分析大的流程大致相同,如图: 数据挖掘一般都要经过过滤、漂洗、匹配三个过程: 1.过滤:主要将数据中的不适合分析的数据过滤掉,就好比产品流水线的残次品一样,对数据进行组粒度的过滤,其规则可按数据大小,字符长短; 2.漂洗:也称格式化,对数据进行分块,数据也有组成的,有时间、数据源、数据体等等,就好比头、身体、脚一样。将数据变成我们想要的格式,此过程也是打标签的过程,意将数据分类处理。 3.匹配:匹配就是抽取字段,将数据中
分类: 其他 发布时间: 04-03 23:35 阅读次数: 0

多线程考点

1. 线程与进程的区别? 地址空间: 同一进程的线程共享本进程的地址空间,进程是独立的地址空间。 资源拥有: 同一进程内的线程共享本进程的资源如内存、I/O、cpu等,但是进程之间的资源是独立的。 健壮性: 一个进程崩溃后,在保护模式下不会对其他进程产生影响
分类: 编程语言 发布时间: 04-03 23:35 阅读次数: 0

Error creating bean with name 'entityManagerFactory' defined in class path resource [org/springframework/boot/autoconfigure/orm/jpa/HibernateJpaAutoConfiguration.class]: Invocation of init method fail

SpringBoot 单元测试报错 @RunWith(SpringRunner.class) @SpringBootTest public class ProductCategoryRepositoryTest { @Autowired private ProductCategoryRepository repository; @Test public void findOneTest(){ ProductCategor
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

造一个轮子然后安装到pypi上

   之前写了一个爬虫的包,主要是根据自己写爬虫的情况总结一下。 因为每次都要重复写一些代码,所以提炼出来,类似一个框架的样子吧。 开始是放在自己的项目里引用,但如果换了一个项目,就得重新拷一遍,很麻烦。 后面又学到了,放在site-package里面可以在自己的环境引用,但换一个环境也是不行的,于是想到放到pypi上面,可以直接pip install,就很方便。    记录一下上传包的过程。 先上一个参考文章https://www.cnblogs.com/sting2me/p/6550897
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

MySql常用函数全部汇总

MySQL数据库中提供了很丰富的函数。MySQL函数包括数学函数、字符串函数、日期和时间函数、条件判断函数、系统信息函数、加密函数、格式化函数等。通过这些函数,可以简化用户的操作。例如,字符串连接函数可以很方便的将多个字符串连接在一起。在这一讲中将讲解的内容包括: 数学函数 字符串函数 日期和时间函数 条件判断函数 系统信息函数 加密函数 格式化函数 MySQL提供了众多功能强大、方便易用的函数,使用这些函数,可以极大地提高用户对于数据库的管理效率,从而更加灵活地满足不同用户的需求。本文将My
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

地铁售票系统设计思想及部分代码

设计思想:地铁售票系统的关键点在于换乘,所以首先要分为换乘和不换乘两种情况。不换乘比较简单,通过起始站名和终点站名查询他们的num,然后list打包输出到jsp就可以。换乘的话就先要找到两条线路,找到两条线路的交点也就是换乘站,然后分别输出起始站到换乘站,换乘站到终点站两段路线就完成了,这里面还涉及到一个最短路径问题,我的想法是把全部的可能线路都找到,然后比较大小就完成了。目前进度到换乘部分。 双人项目合作人:郑锦 部分源代码: package Dao; import java.sql.
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

axis调用Web服务报axis unexpected wrapper element{XXXX}XXX错误的解决

使用axis调用WebService时报错:axis unexpected wrapper element{XXXX}YYY .... expected {XXXX}。 经查,XXXX为wsdl文件中的targetNamespace,YYY为要调用的方法。 解决办法: 将call.setOperationName("YYY")改为: call.setOperationName(new QName("XXXX","YYY"));
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

Java网路通信协议、UDP、TCP协议整理

网络通信协议 网络通信协议有很多种,目前应用最广泛的是TCP/IP协议(Transmission Control Protocal/Internet Protoal传输控制协议/英特网互联协议),它是一个包括TCP协议和IP协议,UDP(User Datagram Protocol)协议和其它一些协议的协议组,在学习具体协议之前首先了解一下TCP/IP协议组的层次结构。 1.1 InetAddress package com.oracle.InetAddress; import java.ne
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

网络知识点总结1

网络知识点总结 1.基础知识 TCP/IP协议:网络当中数据传输过程理解为一次协议 TCP/IP协议简介:TCP/IP是最广泛的通信协议集合,包括大量Internet应用中的标准协议,支持跨网络架构,跨操作系统平台的通信。 主机与主机之间通信的三个要素:ip地址,子网掩码,ip路由 IP地址的作用:用来标识一个节点的网络地址 IP地址版本类别:ipv4(32位);ipv6(128位) IP地址的分类:A类(1-126)B类(128-191)C类(192-223)D类组播(224-239)E类科
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

MySQL之聚合数据(AVG,COUNT,MAX,MIN,SUM)

1.首先我们需要了解下什么是聚合函数   聚合函数aggregation function又称为组函数。 认情况下 聚合函数会对当前所在表当做一个组进行统计。 2.聚合函数的特点   1.每个组函数接收一个参数(字段名或者表达式) 统计结果中默认忽略字段为NULL的记录   2.要想列值为NULL的行也参与组函数的计算,必须使用IFNULL函数对NULL值做转换。   3.不允许出现嵌套 比如sum(max(xx)) 3.聚合函数 count(),求数据表的行数 1 select count(
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

使用Cytoscape画PPI网络图

打开Cytoscape软件,根据菜单导入string_interactions.tsv文件 File ----> Import ----> Network from File 会弹出下图对话框,在对话框中设置如下: 选中string_interactions.tsv文件,点击打开,导入文件,结果如下图所示。 点击OK,弹出如下视图,ctrl+A选中所有基因节点 使用NetworkAnalyzer分析调整网络图 Tools ---> NetworkAnalyzer ---> Network An
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

地铁合作(hjy)

用时大概时间 18 个小时 我的队友是 :黄珺瑜我们一开始的想法是自己建立数据库,用来查询路线,再调用一下百度api作为地图(仅作地图没有任何操作的那种);后来我们的步骤也的确是这样,我们先确定了苏州地铁图为项目对象,然后将它所有的地铁站,线路等信息储存到数据库里,通过建立5个数据表来储存,四个表为线路表,还有一个表是交换站表。并按部就班的设计我们的算法。终于经过我们历时6个小时左右的时间终于把我们的算法设计出来了。 以下是一条线上没有交换站的情况,有交换站的情况,以及两条线的情况: 然而等我
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

2019无锡中科软软件开发面试

第三家中科软,昨天晚上电话面试,问了一些基本情况和两个Java基础问题,Java内存中栈和堆的区别,线程安全的含义,然后约了第二天现场面试,先五十分钟笔试,然后两轮技术面,两点半之前到国联大厦,四点二十离开。 一、笔试(数据库和Java基础) 第一部分:数据库基础选择,涉及数据库,数据库系统,数据库管理系统三者的关系,DDL和DML,数据库系统的核心...      SQL语句 第二部分:Java基础选择,涉及String和StringBuffer,抽象类,异常,继承...      Java
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

STC寄存器大全

EA 总中断 ET2 溢出中断 ES 串口
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

TensorFlow+Keras 03 TensorFlow 与 Keras 介绍

1 TensorFlow 架构图 1.1 处理器 TensorFlow 可以在CPU、GPU、TPU中执行 1.2 平台 TensorFlow 具备跨平台能力,Windows 、Linux、Android、IOS、Raspberry Pi、云端执行 1.3 分布式执行引擎 TensorFlow Distributed Execution Engine 分布式执行引擎 在深度学习中,最花时间的就是模型的训练,尤其大型的深度学习模型必须使用大量数据进行训练,需要数天乃至数周之久,TensorFlo
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

(微信,支付宝)小程序头像上传选择裁剪区域

<!--微信小程序 --> <view> <view bindtap='upEwm'> <view>头像</view> <image style='width:200rpx;height:200rpx;background-color:red' src='{{headImg}}'></image> </view> </view> <!--裁剪图片浮层--> <view class='fixed-upimg' wx:if="{{imageFixed}}"> <v
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

cocos creator实战-(三)简单例子摇杆控制角色移动

1、stick监听cc.Node.EventType.TOUCH_MOVE事件,获取tick移动的坐标和朝向,限制移动的范围 2、根据stick的朝向,每帧更新player的位置和方向 // 摇杆代码 joy_stick.js cc.Class({ extends: cc.Component, properties: { // foo: { // // ATTRIBUTES: // defaul
分类: 其他 发布时间: 04-03 23:34 阅读次数: 0

EXCEL+VBA 管理windows用户 文件服务器用户 新增或删除用户

1.调用DOS命令:netuser获取系统用户到txtfile2.打开txtfile把内容处理(空格全替换为换行;已换行分列)后赋值到A3.把A列不为空的值且不到特殊用户表的值写到临时表4.与EXCEL用户表进行对比使用函数COUNTIF(1)临时表有,用户表没有——编写删除用户命令:"netuser"&Range("a"&i)&&q
分类: 企业开发 发布时间: 04-03 23:30 阅读次数: 0

UPS的分类与比较

最后学习了动力知道,了解一下UPS的分类,内容摘自百度
分类: 企业开发 发布时间: 04-03 23:30 阅读次数: 0

好程序员大数据视频教程从零基础入门到精通

  好程序员大数据视频教程从零基础入门到精通,学习大数据技术的必经之路是什么?是Hadoop吗?当然不是!如果想要踏入大数据的门槛,一个必须的条件就是我们的编程基础。熟练掌握一门编程语言是对大数据开发工程师基本的要求。&nbsp;  就来区分学习大数据的小伙伴们水平来看,大多数对于编程并没有一个很好的基础,所以老师在学习大数据技术课程之初,就将Java课程列为基础课程,但因为我们的大数据课程还是以
分类: 企业开发 发布时间: 04-03 23:30 阅读次数: 0