记一次excel数据整理

记一次excel数据整理

背景:现有1000多条客户数据生成的pdf文件。想要将成整理出来成可自由查询导入导出的excel格式,或者更进一步导入数据库中。

做法如下:

  • Pdf分割
  • 利用wps工具转化word格式
  • 从word中将表格数据拷贝到excel中
  • *整理excel中的数据
  • 将excel的数据存入txt格式
  • 将txt格式导入到mysql中
  • 在mysql中操作数据

pdf分割

为什么要pdf分割,因为wps转化工具限制(免费版只能一次转化5页)。干这一步的原因主要是哥没有钱。
网上pdf分割工具有很多,如http://www.ilovepdf.com/zh_cn/fencai_pdf
这个操作就不多说了。

pdf转化为doc格式

这个网上有很多工具,但是最近发现wps这个广告弹窗不少的国产软件竟然推出的“金山PDF转Word”工具还不错。大家可以用一下。

我就是使用的该工具转化成的。基本上不变型,特别是表格。但是出现好多好多隐藏的单元格。这就不得不在拷入excel进行格式处理。而格式处理是一个很繁琐的工作。

将数据从doc中拷入excel中

该步不多说了。

整理excel数据格式

技巧一 定位功能的运用

定位 空值 删除 空行

技巧二 if的运用

=if(or(d1="男",d1="女"),d1,d1&e1)

这个是用在下面这个情况

D E F
李制 环科院
张红 XX公司

这可以新建一列,在新建一列中输入判断语句就可以将一些单元格数据合并了。

技巧三 复制值

excel中,可以复制公式后,会引用原公式产生的值,可以选择式粘贴为值。

技巧四 存为txt格式

为了导入mysql中,可以将单张表存为txt格式
存储格式如下

1   张X  男   巡视员 住建部         
2   徐X  男   董事长 XX设计研究总院            
3   吴XX 男   副院长 XXX设计研究总院           
4   张X  男   副院长 XXX设计研究总院           
5   李XX 男   总工程师    XXX股份有限公司           

中间空格实为’\t’

导入mysql

按excel中字段顺序建好mysql表格。
然后使用如下命令导入

use antdz_oa;/*使用antdz_oa数据库*/
load data local infile 'D:\data.txt' into table oa_customer fields terminated by '\t';
835 丁彩娟 副编审 《中国给水排水》杂志社 022-27835913
836 彭秀华 编辑 《中国给水排水》杂志社 022-27835707
837 刘贵春 编辑 《中国给水排水》杂志社 022-27832819
838 金晟 会计 《中国给水排水》杂志社 022-27836823
839 孙磊 广告部 《中国给水排水》杂志社 022-27835592

优化数据库

上面的那个表格中单位重复太多,我想在mysql中建一个单位表用于储备单位
先建一个单位表(oa_unit)

id title
int(8) varchar(100)

mysql命令,将oa_customer中的单位写入oa_unit中

insert into oa_unit(title) select distinct unit from oa_customer;

写入oa_unit表后,再把oa_unit的单位的id对于单位名称写入oa_customer中。

 update oa_customer,oa_unit set oa_customer.unit_id = oa_unit.id where oa_customer.unit = oa_unit.title;

猜你喜欢

转载自blog.csdn.net/antdz/article/details/51923476
今日推荐