LogisticRegression_model(Python)
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn import preprocessing
from sklearn.model_selection import train_test_split,cross_val_score,GridSearchCV
from sklearn.fea...
bayes_classification_model(Python)
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import class...
bayes_regression_model(Python)
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import BayesianRidge
from sklearn.metrics import mean...
svc_model(Python)
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn import preprocessing
from sklearn.model_selection import train_test_split,GridSearchCV,cross_val_score
#特征选择
from sklea...
svr_model(Python)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import preprocessing
from sklearn.model_selection import train_test_split,GridSearchCV
...
collections容器
Python附带一个模块,它包含许多容器数据类型,名字叫作collections。我们将讨论它的作用和用法。
我们将讨论的是:
defaultdict
counter
deque
namedtuple
enum.Enum (包含在Python 3.4以上)
defaultdict
与dict不同 不需要检查key是否存在 例子:
>>> from collect...
安装epel源 centos6
1.安装yum优先级插件
yum install yum-priorities
2.epel简介: https://fedoraproject.org/wiki/EPEL/zh-cn
rpm -Uvh http://mirrors.ustc.edu.cn/fedora/epel/6/x86_64/epel-release-6-8.noarch.rpm
rpm -Uvh http://...
mysql5.7 MHA搭建(复制+binlog开启)
MHA介绍
MHA,即MasterHigh Availability Manager and Toolsfor MySQL,是日本的一位MySQL专家采用Perl语言编写的一个脚本管理工具,该工具仅适用于MySQLReplication 环境,目的在于维持Master主库的高可用性。
MHA(Master High Availability)是自动的master故障转移和Slave提升的软件包...
python迭代器和生成器(1) -- python cookbook
你想遍历一个可迭代对象中的所有元素,但是却不想使用for循环。
为了手动的遍历可迭代对象,使用 next() 函数并在代码中捕获 StopIteration 异常。 比如,下面的例子手动读取一个文件中的所有行:
>>> def manual_iter():
... with open('/etc/passwd') as f:
... try:
... ...
迭代器和生成器(2)--python cookbook
跳过可迭代对象的开始部分
itertools 模块中有一些函数可以完成这个任务。 首先介绍的是 itertools.dropwhile() 函数。使用时,你给它传递一个函数对象和一个可迭代对象。 它会返回一个迭代器对象,丢弃原有序列中直到函数返回Flase之前的所有元素,然后返回后面所有元素。
>>> with open('/etc/passwd') as f:
.....
mysql - show global status(全局参数目录解说)
[root@mysqldb ~]# mysql -uroot -e 'show global status' -p
show global status
show status
show session status
mysql(RDS)常用性能指标监控
Mysql
1.1.1监控指标说明
主要针对SQL耗时、吞吐量(QPS TPS)命中率 锁等待等指标进行监控。
本来运维工具产品有以下参数:
TPS/QPS
连接数
每秒SQL执行次数
全表扫描数
InnoDB缓冲池命中率
InnoDB缓冲池使用率/脏块率
InnoDB逻辑读
排序记录数
InnoDB锁等待次数
InnoDB脏页数量
InnoDB读写量
Inn...
variables-bin有关
root@itpux 14:40: [(none)]> show variables like ‘%bin%’;
Variable_name
Value
bind_address
192.168.1.117
binlog_cache_size
32768
binlog_checksum
CRC32
binlog_direct_n...
python 爬虫 --字符编写问题
python爬虫后出现字符串问题
测试用例:
[root@izwz9eitqs320brxl6owssz ~]# python
Python 2.7.5 (default, Nov 6 2016, 00:28:07)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-11)] on linux2
Type "help", "copyright", "c
正则表达式-py爬虫篇
re.match
re.match试着从字符串的起始位置匹配一个模式,
若不能从起始位置匹配成功,match()就返回none.
常见匹配
import re
content = 'Hello 123 4567 World_This Demo'
res = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}\sDemo$', cont...
python爬取douban读书
通过两天的速成学习,自己写了py的代码来爬豆瓣。
要注意的还是很多的cookie User-Agent
还有字符串编辑问题- (使用的是pycharm 记得设置字符格式为UTF8)
# -*- coding: UTF-8 -*-
import threading
import pymongo
import requests
import re
import random
import tim...
判断二叉树是否平衡问题
题目描述
实现一个函数,检查二叉树是否平衡,平衡的定义如下,对于树中的任意一个结点,其两颗子树的高度差不超过1。
给定指向树根结点的指针TreeNode* root,请返回一个bool,代表这棵树是否平衡。
给出数据结构:
public class TreeNode {
int val = 0;
TreeNode left = null;
TreeNode ri...
scrapy crawl spider执行报错(windows)
1.SyntaxError: invalid syntax
调用的addoutput里面的也要将async参数更改为shark,因为下面的if判断,源码里面都是用的shark,又不是async,识别不了async
def write(self, data, shark=False):
self.handler.addOutput(data, shark)
...
python scrapy框架爬取豆瓣top250电影篇一scrapy原理介绍
Scrapy
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。
其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。...
今日推荐
周排行