借助 OCR 工具识别图片中的文本,然后根据预设的规则依据图片中的文本对图片进行分类,最后依据分类结果将图片移动到不同的目录中
3.8+
使用 Microsoft Store 版本时,需要启用 Windows 长路径支持
如果你使用的 Python 版本较高,在安装时可能会遇到以下问题:
Looking in indexes: https://www.paddlepaddle.org.cn/packages/stable/cpu/
ERROR: Could not find a version that satisfies the requirement paddlepaddle==3.3.0 (from versions: none)
ERROR: No matching distribution found for paddlepaddle==3.3.0
遇到此问题时,改用 Transformers 即可。
使用 Transformers 作为推理引擎时,还需要安装 torchvision:
pip install torchvision推理引擎配置在 src/ocrClassify.py:
def _paddleOcrLoad():
import paddleocr
r = paddleocr.PaddleOCR(
# ......
engine="transformers", # Line 21
)
return r当前配置的推理引擎为 Transformers,使用 PaddlePaddle 请删除/注释对应的行。
屏幕截图分类只需要基础的 OCR 功能,安装时可以只安装 paddleocr 而不是 paddleocr[all]。
python run.py src_path classify_config dst_path_format [-r] [-f filter] [-d date_format] [-D default_class] [-L logging_level]src_path 是存放图片的目录的路径,使用 -r 以包含子目录中的文件
filter 用于根据文件后缀名筛选文件,默认值为 png|jpg|jpeg|bmp,格式参照默认值即可
特殊:单独的 * 用于关闭筛选(接受所有文件)
classify_config 用于指定分类配置文件的路径
dst_path_format 是目标路径的模板,在模板中 {0} 表示文件的修改日期,{1} 表示首选分类结果(注:程序中使用 str.format 方法进行格式化)
-d date_format 用于指定模板中文件修改日期的格式,默认值为 %F,效果为 2025-04-26(注:程序中使用 datetime.strftime 方法进行格式化)
-D default_class 用于指定默认分类
当图片没有任何分类结果时,将默认分类作为首选分类结果
若不指定默认分类,则当图片没有任何分类结果时,图片不会被移动
-L logging_level 用于指定日志级别,默认为 WRANING
实验性功能,预计未来将删除此功能