2024.4.19任务
1.1~1.2、Anacinda navigator的基本使用
1.如何安装:
点击下方链接选择合适版本下载:
Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
(windows64位可用:anaconda3-5.0.1-windows-x86.exe)
2.工具界面认识:
使用Spyder,操作界面与Matlab类似。两个输入框,一个输出框
3.安装拓展包:
在Anaconda Prompt中使用字符命令的方式进行拓展
pip list :显示已经安装的包
pip install 安装包名:安装第三方包
1.3~1.6、python的基本数据类型
1.数据说明:
1.类型主要有:数值(int,float,double,eval)、字符串(string)、队列(list)、[强制转化类型才会用到类型说明]
2.元组、集合、字典(又被叫做数据容器)
区别:元组中的元素不可修改,集合具有不可重复性(相同元素只保留第一个),字典中主键的数据类型需要一致,而值不用。
集合、元组、列表和字典中的值中的数据类型可以不一样
2.数据操作:
1.主要包括:索引、切片、求长度、统计、成员身份确定、变量删除
(1)索引:在字典以外的数据容器中使用hash索引 既使用角标来索引
而字典使用码(主键)进行索引
(2)切片:字符串的切片 a[n:m] ----> a[n]~a[m-1] 如果没写时默认n=0,m=len(str)-1
(3)求长度:len(变量名)
(4)统计: 包括求最值(max,min)、求和(sum)
(5)确定成员变量: 元素+in+元素组 (返回True或者False)
(6)变量删除: del 变量1,变量2 【其实相当于变量1、2没用了,被回收空间】
3.列表方法:
1.主要包括:空列表、向列表增加元素、列表扩展、列表中的元素统计、返回列表索引下标、删除列表元素、排序
(1).创建空列表: 变量名=list() / 变量名=【】
(2).向列表增加元素: list名.append(添加元素)
(3).列表扩展: list名.extend(末尾增加的元素组)
(4).列表中的元素统计: list名.count(“元素”) (统计该元素在list里的出现次数)
(5).返回列表索引下标: list名.index(元素) (该元素在list中的角标)
(6).删除元素: list名.remove(元素) (删除在list里第一次出现的该元素)
(7).排序: list名.sort() (升序排序)
4.元组方法:
1.主要包括:空元组、统计、返回索引、元组的连接
(1). 创建空元组:变量名=tuple() / 变量名=()
(2).统计: tuple名.count(“元素”) (统计该元素在tuple里的出现次数)
(3).返回索引: tuple名.index(元素) (该元素在tuple中的角标)
(4)连接: tuple1+tuple2 (与字符串一致用+进行连接)
5.字符串方法:
1.主要包括:空串、找子串、字符串替换、比较和连接
(1).创建空串: 变量名=str()
(2).找子串: str名.find(“具体的字符串”,开始索引位置,结束索引位置+1) (返回字串第一次出现的索引位置,没有就返回-1)
(3).字符串替换:str名.replace("字符1",“字符2”) (将str中的‘“字符1”全部换成“字符2”)
(4).连接与比较: str1+str2 【连接用+、比较用<、>、==】 比大小比的是字典序
6.字典方法:
1.主要包括:创建、
(1).创建字典:
空字典创建:变量名=dict() / 变量名={}
带参数的字典创建:变量名=dict( [ () , () , () ] ) # 嵌套元素为元组
变量名=dict( [ [],[],[],[] ] ) # 嵌套元素为列表
(2).获取字典值:
字典名.get(键) #返回字典中这个键所对应的值
(3).字典赋值:
字典名.setdefault(键,值) #对预定义的空字典赋值
1.7~1.10、python设计结构
1.设计结构
1.条件语句: if…else… / if…elif…else
2.循环语句:for _ in range(): / while 条件:
2.函数(只是简单表述,在python里要注意首行缩进)
1.无返回值函数:
def 函数名(): 函数体
2.有返回值函数:
def 函数名(): 函数体 return返回变量
3.有多个返回值函数:
def 函数名(): 函数体 return(返回变量1,返回变量2,……)
3.大数据与python:
1. 大数据的5v特点:volume(大量)、velocity(高速)、variety(多样)、value(低价值密度)、veracity(真实)
2.数据挖掘常用的库:Numpy,Pandas,Matplotlib,scikit-learn。