matplotlib可视化

from pymongo import MongoClient import matplotlib.pyplot as plt from pylab import * mpl.rcParams['font.sans-serif'] = ['SimHei'] #添加汉字/ #用来正常显示中文标签 mpl.rcParams['axes.unicode_mi...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

结巴分词,文本聚类,情感分析,词云图可视化

import re import numpy import jieba import jieba.analyse # 提取关键内容 import jieba.posseg as pseg # 词性标注 from pymongo import MongoClient from sklearn.feature_extract...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

Mongodb数据库删除数据为0的数据信息

from pymongo import MongoClient def clink_DB(): client = MongoClient('localhost', 27017) # 链接数据库 db = client['Taoguba'] db.Taoguba.remove({"Content": ''}) db.Taoguba.remove({"Talk": ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

百度自动查询信息辅助工具

from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.support.ui import ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

GBDT见习

GBDT主要由三个概念组成:Regression Decistion Tree(即DT),Gradient Boosting(即GB),Shrinkage (算法的一个重要演进分枝,目前大部分源码都按该版本实现),是一种用于回归的迭代决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。一、 DT:回归树 Regression Decision TreeGBDT中的树都是回归树,不是...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

数据建模五大步(以KNeighborsClassifier算法为主)

''' KNeighborsClassifier ''' from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier import pickle #pickle模块 from...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

GBDT、KNN数据建模分析步骤

from sklearn.neighbors import KNeighborsClassifier from sklearn import ensemble from sklearn.model_selection import train_test_split from sklearn import preprocessing from sklearn.learning_curve i...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

Python一些实用的函数

一、filter() 函数 用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。 该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。 语法: filter(function, iterable) function – 判断函数。 iterable – 可迭代对...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

Redis的几个常用操作

Redis的几个常用操作 ”’ Redis通常被称为数据结构服务器 特点:支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用 使用connection pool来管理对一个redis server的所有连接,避免每次建立、释放连接的开销。 默认,每个Redis实例都会维护一个自己的连接池。 可以直接建立一个连接池,然...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

PyPDF2读取PDF文件内容保存到本地TXT

利用PyPDF2读取PDF文件内容保存到本地TXT from PyPDF2.pdf import PdfFileReader import pandas as pd def Pdf_to_txt(pdf): for i in range(0, pdf.getNumPages()): title = [] lin1, lin2, lin3, lin4, lin5, lin6,...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

Pdfminer读取PDF文件内容保存到本地TXT

from pdfminer.converter import PDFPageAggregator from pdfminer.layout import LTTextBoxHorizontal, LAParams from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.pdfint...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 2

Pandas读取网页中的表格内容,并将其写入Excel中

Pandas的read_html方法能够读取带有table标签的网页中的表格 示例: import pandas as pd data = pd.DataFrame() # 带有table标签的URL url_list = ['http://www.espn.com/nba/salaries/_/seasontype/4'] for url in url_list: data = d...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

基于SpringBoot开发一套完整的项目(一)

1.1 SpringBoot简介① 为所有Spring 开发提供一个更快更广泛的人门体验。② 零配置。无冗余代码生成和XML 强制配置,遵循“约定大于配置” 。③ 集成了大量常用的第三方库的配置, Spring Boot 应用为这些第三方库提供了几乎可以零配置的开箱即用的能力。④)提供一系列大型项目常用的非功能性特征,如嵌入式服务器、安全性、度量、运行状况检查、外部化配置等。1.2 Spring ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

基于SpringBoot开发一套完整的项目(二)

1.SpringBoot框架内容        想了一下,觉得在开发之前应该先大致了解一下springboot框架的概括,然后在后面的开发过程中再进一步加深理解,做到知其然知其所以然!Spring Boot 是基于Spring 框架技术来构建的,所以Spring Boot 又会使用很多Spring 框架中的技术。要了解springboot不可避免的我们要了解好spring框架。        Sp...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

基于SpringBoot开发一套完整的项目(四)

1. 数据持久化 1.1 JPA         在JPA 产生之前,围绕如何简化数据库操作的相关讨论已经是层出不穷,其中ORM 框架最为开发人员所关注。ORM是一种用于实现面向对象编程语言里不同类型系统的数据之间的转换的技术,它们将对象拆分成SQL 语句,从而来操作数据库。但是不同的ORM 框架在使用上存在比较大的差异,而JPA 规范就是为了解决这个问题:规范ORM 框架,使用ORM 框架统一的...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

基于SpringBoot开发一套完整的项目(五)

接下来,就要正式开始我们的项目了,基于springboot的博客系统。1. 架构设计与分层        目前,比较常用的、典型的应用软件倾向于使用三层架构,即表示层、业务层和数据访问层。        ( 1 ) 表示层:提供与用户交互的界面。GUI (图形用户界面)和Web 页                  面是表示层的两个典型的例子。需要HTML 、css 、JavaScript 等之类...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

【JS】定时器的理解及验证

在js中,定时器的运用也算是比较广泛吧,很多时候我们乱用定时器,可能会出现意外的bug,下面由我来带领大家理解一下定时器的运用;先把总结抛出来吧;1.假如定时器编写在上下文中,定时器在最后运行;如果上下文有多个定时器,在上下文结束后按照顺序并发;2.假如定时器在方法体中,定时器则在方法体最后执行;一张图片验证一下吧;简单的代码能说明很多哦;由 ①②③,个地方输出1是一个方法 ;2.是一个定时器  ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

【JS】实现拖动div右侧改变,改变div宽度 /及拖动div的整理

先看看效果吧.   【拖动右侧改变div的宽度】一开始也挺蒙的,不晓得思路,我就思考,先是获取到右侧的边缘->触发事件->拖动-->改变宽度;然后都不晓得怎么实现.我发挥面向百度编程一波下来,找到一个类似博客(点击跳转)<--就是这个啦好啦,说我改编过的代码;相当简短;     因为我的td是动态生成的,所以直接绑定事件/* author: YangMingWei ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

SpringMVC 学习笔记(一)

一、SpringMVC 框架原理二、入门程序:1). web.xml<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://java.sun.com/xml/ns/javaee" ...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3

Windows 命令查询指定端口占用的进程和关闭

以端口80为例:1.查找对应的端口占用的进程:netstat  -aon|findstr  "80"    ,找到占用8080端口对应的程序的PID号:2.根据PID号找到对应的程序:tasklist|findstr "PID号"    ,找到对应的程序名3.结束该进程:taskkill /f /t /im 程序名转载自:https://jingyan.baidu.com/article/3c48...
分类: 其他 发布时间: 06-13 23:57 阅读次数: 3