栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > C/C++/C#

CVPR2020场景文字数据增强(纯python实现)

C/C++/C# 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

CVPR2020场景文字数据增强(纯python实现)

CVPR2020论文:

《Learn to Augment: Joint Data Augmentation and Network Optimization for Text》

原文链接:

https://openaccess.thecvf.com/content_CVPR_2020/papers/Luo_Learn_to_Augment_Joint_Data_Augmentation_and_Network_Optimization_for_CVPR_2020_paper.pdfhttps://openaccess.thecvf.com/content_CVPR_2020/papers/Luo_Learn_to_Augment_Joint_Data_Augmentation_and_Network_Optimization_for_CVPR_2020_paper.pdfC++代码实现:

GitHub - Canjie-Luo/Text-Image-Augmentation: Geometric Augmentation for Text Imagehttps://github.com/Canjie-Luo/Text-Image-AugmentationPython代码实现:

GitHub - RubanSeven/Text-Image-Augmentation-python: Python implementation of Text-Image-Augmentationhttps://github.com/RubanSeven/Text-Image-Augmentation-python

前言

场景文字的数据标注是高成本的,因此很多情况下,我们会遇到数据不足的情况。然而,目前最前沿的文字识别算法都是基于深度学习的,数据的数量和质量很大长度上决定了模型的效果,甚至在数据严重不足的情况下,模型都很难收敛或者过拟合。

本文将介绍一种场景文字的数据增强方法,在一些开源项目和论文中都有使用,原版本是c++实现,对环境有很高的要求,本文用python重写了该方法,速度稍有下降,但是也达到了实时数据增强的效果。

安装 NumPy 最简单的方法就是使用 pip 工具:

pip3 install --user numpy scipy matplotlib

--user 选项可以设置只安装在当前的用户下,而不是写入到系统目录。

默认情况使用国外线路,国外太慢,我们使用清华的镜像就可以:

pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

没有找到cv2
应该安装opencv-python

pip install opencv-python
 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/303402.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号