pyqt5 的多线程(QThread)遇到的坑(二)

前言

前面在pyqt5多线程(QThread)遇到的坑(一)中提到了先实例化类,再把实例对象传参到线程类,这样的确实可行,但是还是遇到了新坑。
pyqt5多线程(QThread)遇到的坑(一

起因

被实例化的类是做数据处理的,传入和导出的的数据比较大,最少都是几万行的excel表格数据(pandas.DataFrame),而且传入的数据最少两个pandas.DataFrame表,多的时候会传入7个,而且有一些数据是公共数据,每次处理都必须处理的,直接放在数据处理类的初始化__init__中了,而这部分数据处理也是稍微有的耗时,那么坑就来了,先实例化数据处理类,那么这部分稍微耗时的数据处理也会导致UI界面卡死一小会,郁闷!虽然是卡死一小会,但我们是多线程处理,还会又卡死的现象那这个多线程的意义岂不是大打折扣。其实一开始并不知道是这里的先实例化导致的,经过反复实验后才发现,既然确定了这里的问题,那就只能把实例化的过程放到线程内了,但是放到线程内,那给这个数据分析类传参怎么办?

处理方法

反复实验后,总结爬坑路线如下:
修改数据分析类的参数格式为:字典 → 把多线程类在最后增加一个参数“**kwargs”→在线程内实例化数据分析类 → 直接把多线程类接受数据的参数kwargs扔进去→数据分析类内接受数据的全局变量需要调整下,增加try,因为不是每次都传入所有数据,没有传入的数据会报错。

整体代码逻辑:
class main(object):
	def analyze_data(self, pick_filename: str):
	    """
	    数据分析,使用多线程启动数据分析
	    """
	   # 之前是先实例化数据分析类再启动线程,数据分析类初始化时也耗时,会导致UI卡死一会,这里把实例化工作放到线程内进行
	  self.analyze_thread = MoreThreadAnalyze(path_name, data0=self.in_out_data, data1=data)  # path_name 分析后文件保存路径,data0和data1是这次要传入的两个几万行的pandas.DataFrame
	  self.analyze_thread.end_signal.connect(self.alert_win)
	  self.analyze_thread.start()  # 启动线程
	
	def alert_win(self, path):  # 接受线程结束信号的槽
		print(path)


  class MoreThreadAnalyze(QtCore.QThread):
	  """
	  使用多线程进行出入库数据修改,传递数据为pandas.DataFrame 不能用信号传递,直接写入二进制文件pickle
	  pick_name: 将要保存的文件路径和文件名(pick文件)
	  **kwargs: 传入要分析的数据
	  """
	  end_signal = QtCore.pyqtSignal(str)
	
	  def __init__(self, pick_name: str, **kwargs):
	      super().__init__()
	      self.kwargs = kwargs  # 这里将得到一个字典,字典的value就是传递的pandas.DataFrame 表格
	      self.pick_name = pick_name  # 分析完成后保存文件的路径
	
	  def run(self):  
	      self.instense_name = TMDataAnalyze(self.kwargs)  # 线程内实例化数据分析类,直接把
	      data = self.instense_name.more_prepare_analyze()  # 数据分析并获得分析结果,其实这里是应该加判断的,数据分析类内不是只有more_prepare_analyze()这一个分析方法,所有这样里应该按传入的数据是哪个表格,以启动对应的数据分析方法,if判断相信你懂的,这里省略了。
	      data.to_pickle(self.pick_name)  # 把分析后数据保存为 pickle文件
	      self.end_signal.emit(self.pick_name ) # 发出信号告诉UI本线程结束,顺便把保存文件路径再传递出去
  
  class TMDataAnalyze(object):
	  """
	  导入数据,并进行分析, 参数:
	  data:需要分析的源数据,字典格式
	  """
	  def __init__(self, data: dict):
	  """
	  这里定义的全局变量前必须加try了,因为不是每次都传入全部参数,没有传入的会报错,导致程序崩溃
	  """
	      try:
	          self.data0 = data["data0"] 
	      except Exception as er:
	          print(er)
	          self.data0 = None
	      try:
	          self.data1 = data["data1"] 
	      except Exception as er:
	          print(er)
	          self.data1 = None
	      try:
	          self.data2 = data["data2"]  
	      except Exception as er:
	          print(er)
	          self.data2 = None
	      try:
	          self.data3 = data["data3"] 
	      except Exception as er:
	          print(er)
	          self.data3 = None
	      try:
	          self.data4 = data["data4"]  
	      except Exception as er:
	          print(er)
	          self.data4 = None
	      try:
	          self.data5 = data["data5"]  
	      except Exception as er:
	          print(er)
	          self.data5 = None
	          ......

     def more_prepare_analyze(self):
     	pass  # 具体数据分析过程省略
        
  if __name__ == "__main_":
  	ana = main()
  	ana.analyze_data()
总结

个人完成后再猜测这样做的优缺点,除了解决了当前UI卡一会的问题之外,还应该有两点:
缺点:线程类被强制耦合了,只能用在数据分析这个模块了。不过也不是大问题,线程类比较简单,十几行代码,再创建一个公用就是了。
优点:原来实例化是在UI主线程全局中的,那么数据分析完成后,数据保存文件,但原来那些赋值为十几万行表格的变量一直在呀!多占资源!放在线程中,运行完就结束了,应该是节省了资源吧!

原创文章 12 获赞 20 访问量 1477

猜你喜欢

转载自blog.csdn.net/wuwei_201/article/details/104803019