PaddleOCR在MacOs Ventura M1上冻结



这是我第一次在这里发布

我一直在开发一个python脚本,使用PaddleOCR从照片中获取文本。显然,在Windows x64上,一切都能正常工作。我通过手动编译一些依赖项,如MuPdf和lanms-neo,成功地在我的MacBook Pro M1上安装了paddocr。然而,脚本永远挂在paddocr上,试图处理图像,cpu为100%,但什么也没发生。我已经在我的windows机器上测试了上面的例子,它立即运行。有没有人有过类似的经历,知道如何在我的M1上工作?

from paddleocr import PaddleOCR
ocr = PaddleOCR(lang='en')
lines = ocr.ocr('<path to image>')
text = ''
for string in lines:
text += " " + string[1][0].replace(' ', '')

我尝试过不同的python版本,3.9.6是唯一一个在M1上使用paddOCR的版本。pip3安装的桨板包装并不简单。在安装他们的python包之前,我不得不手动编译MuPdf 1.19、lanms neo和freetype2的轮子,因为即使安装了python dev,他们也无法获得一些头部。安装成功,没有任何错误,也没有任何依赖项丢失。包飞桨安装没有问题与pip3。

我有一台M1 Mac,上周用了以下版本:

pip install paddlepaddle==2.3.2
pip install paddleocr==2.6.1.0
pip install opencv-python==4.5.5.64
pip install https://github.com/pymupdf/PyMuPDF/archive/master.tar.gz

答案来源请查看此处

我遇到了同样的问题,并尝试了上面的所有建议,仍然看到CPU繁忙,但进程似乎没有返回。我们是否可以传递任何命令或标志来查看OCR过程在做什么?我已经设置了show_log=True,它似乎没有添加足够的细节。

[2023/09/12 16:23:54] ppocr DEBUG: Namespace(help='==SUPPRESS==', use_gpu=False, use_xpu=False, use_npu=False, ir_optim=True, use_tensorrt=False, min_subgraph_size=15, precision='fp32', gpu_mem=500, gpu_id=0, image_dir=None, page_num=0, det_algorithm='DB', det_model_dir='resources/models/en_PP-OCRv3_det_infer', det_limit_side_len=960, det_limit_type='max', det_box_type='quad', det_db_thresh=0.3, det_db_box_thresh=0.3, det_db_unclip_ratio=1.5, max_batch_size=10, use_dilation=False, det_db_score_mode='fast', det_east_score_thresh=0.8, det_east_cover_thresh=0.1, det_east_nms_thresh=0.2, det_sast_score_thresh=0.5, det_sast_nms_thresh=0.2, det_pse_thresh=0, det_pse_box_thresh=0.85, det_pse_min_area=16, det_pse_scale=1, scales=[8, 16, 32], alpha=1.0, beta=1.0, fourier_degree=5, rec_algorithm='SVTR_LCNet', rec_model_dir='resources/models/en_PP-OCRv3_rec_infer', rec_image_inverse=True, rec_image_shape='3, 48, 320', rec_batch_num=6, max_text_length=25, rec_char_dict_path='/Users/ggao/intuit/github/cortex/ocr-paddle/.venv/lib/python3.10/site-packages/paddleocr/ppocr/utils/en_dict.txt', use_space_char=True, vis_font_path='./doc/fonts/simfang.ttf', drop_score=0, e2e_algorithm='PGNet', e2e_model_dir=None, e2e_limit_side_len=768, e2e_limit_type='max', e2e_pgnet_score_thresh=0.5, e2e_char_dict_path='./ppocr/utils/ic15_dict.txt', e2e_pgnet_valid_set='totaltext', e2e_pgnet_mode='fast', use_angle_cls=True, cls_model_dir='resources/models/ch_ppocr_mobile_v2.0_cls_infer', cls_image_shape='3, 48, 192', label_list=['0', '180'], cls_batch_num=6, cls_thresh=0.9, enable_mkldnn=False, cpu_threads=10, use_pdserving=False, warmup=False, sr_model_dir=None, sr_image_shape='3, 32, 128', sr_batch_num=1, draw_img_save_dir='./inference_results', save_crop_res=False, crop_res_save_dir='./output', use_mp=False, total_process_num=1, process_id=0, benchmark=False, save_log_path='./log_output/', show_log=True, use_onnx=False, return_word_box=False, output='./output', table_max_len=488, table_algorithm='TableAttn', table_model_dir=None, merge_no_span_structure=True, table_char_dict_path=None, layout_model_dir=None, layout_dict_path=None, layout_score_threshold=0.5, layout_nms_threshold=0.5, kie_algorithm='LayoutXLM', ser_model_dir=None, re_model_dir=None, use_visual_backbone=True, ser_dict_path='../train_data/XFUND/class_list_xfun.txt', ocr_order_method=None, mode='structure', image_orientation=False, layout=True, table=True, ocr=True, recovery=False, use_pdf2docx_api=False, lang='en', det=True, rec=True, type='ocr', ocr_version='PP-OCRv4', structure_version='PP-StructureV2')

这是唯一一条线,这个过程永远停留在这里。

最新更新