python统计子文件夹内图像个数，画图分析类别长尾分布 - 代码天地

python统计子文件夹内图像个数，画图分析类别长尾分布

企业开发 2023-06-19 02:37:54 阅读次数: 0

许多分类数据集是按照文件夹名字命名类别的，比如VOC数据集：

以我自己的数据集为例，分析各个类别之间的数据平衡情况，用以下脚本实现：

import os
import matplotlib.pyplot as plt

path = 'soybeanleaf'
dirs = os.listdir(path)
num_dir = len(dirs)
num = []

for i in range(num_dir):
    file_i = os.listdir(path + '/'+ dirs[i])
    num.append(len(file_i))

print(dirs)
print(num)

d = dict(zip(dirs,num))
sort_d = sorted(d.items(),key = lambda item:item[1],reverse = True)
x = []
y = []
for it in sort_d:
    x.append(it[0])
    y.append(it[1])

plt.barh(x[0:num_dir],y[0:num_dir])
plt.yticks(fontproperties = 'Times New Roman', size = 2)
plt.savefig('leafdir.png',dpi=300)

脚本输出子文件夹的名称，以及对应文件夹下的文件个数

同时，将该数据集进行数据分布统计，画出条形图：

从以上结果，可以分析出该数据集各个类别的数据分布情况，哪些类别数据较多，哪些类别数据较少，可以针对该情况，对算法分类结果进行分析。

猜你喜欢

转载自blog.csdn.net/u013685264/article/details/126362797

python统计子文件夹内图像个数，画图分析类别长尾分布

Java与Python统计文件夹及子文件夹下文件个数

C++遍历统计某个文件夹及其子文件夹下所有图像和像素的个数

MATLAB遍历文件夹及其子文件夹，读取多幅相关图像画图

python统计文件夹中所有文件夹及文件的个数

shll 统计文件夹及文件个数

python3 统计文件夹下文件（含文件夹）的个数

Python 递归读取文件夹内所有文件名（包含子文件夹）

python copy文件夹内的文件

文件夹中含有子文件夹，修改子文件夹中的图像存储格式（python实现）

python 遍历文件夹及子文件夹

Python 统计文件夹内所有pdf页数的小工具

Linux统计文件夹中文件的个数

【OpenCV-Python】：批量读取文件夹内图像并显示

python统计文件夹大小

递归统计文件夹大小------python

查看文件夹下文件个数，子文件夹中文件个数

python如何读取文件夹下的子文件夹

jenkins统计文件夹数目或删除N天前的子文件夹

Python删除指定文件夹内指定文件

如何使用Python核对文件夹内的文件

Python中文件夹内匹配文件通用脚本

Linux统计某文件夹下文件、文件夹的个数

Linux统计某文件夹下文件、文件夹的个数（转）

Linux随笔 - Linux统计某文件夹下文件、文件夹的个数

【python小工具】读取文件夹内所有图像，合成视频&gif动图

计算多个文件夹中，总文件个数（python）

【python】实现输出文件夹中的文件个数

Python合并文件夹（含子文件夹）下的所有TXT文件

python遍历文件夹及其子文件夹中的所有文件

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)