Inventaire des papiers de détection et de reconnaissance de texte CVPR 2020

Cet article dresse un inventaire de tous les articles liés au texte et à l'image (texte) dans le CVPR 2020, qui sont principalement divisés en deux directions : le texte manuscrit et le texte de scène, avec un total de 16 articles. La littérature est soigneusement classée et la plupart des articles se concentrer sur la recherche sur les questions de reconnaissance.

Les instructions comprennent :


1) Détection de texte de scène (Scene Text Detection), qui détecte la position du texte à partir de textes de scène tels que des vues de rue, et les deux documents sont la détection de texte irrégulier et de forme arbitraire ;

2) Reconnaissance de texte de scène (Reconnaissance de texte de scène), qui reconnaît les résultats de la détection de texte de scène, un total de 4 articles ;

3) Reconnaissance de textes manuscrits, 2 articles ;

4) Reconnaissance de bout en bout du texte de la scène (Scene Text Spotting), 1 article, c'est-à-dire l'algorithme ABCNet en temps réel proposé par des chercheurs de l'Université de technologie de Chine du Sud et de l'Université d'Adélaïde, est très attrayant et a été source ouverte ;

5) Génération de texte manuscrit (Génération de texte manuscrit), afin d'augmenter les échantillons de formation de texte manuscrit (on a l'impression qu'il peut également être utilisé pour « écrire des devoirs » « manuellement drôles »), 1 article ;

6) Synthèse de texte de scène (Scene Text Synthesis), afin d'augmenter les échantillons d'entraînement de texte de scène, 1 article, de Megvii Technology, UnrealText utilise un moteur de rendu pour générer un texte de scène réaliste ;

7) Augmentation des données des images de texte pour la formation des algorithmes d'écriture manuscrite et de reconnaissance de texte de scène, 1 article ;

8) Scene Text Editor (Scene Text Editor), pour remplacer le texte dans l'image du texte de la scène ;

9) Reconstruction de documents papier déchiquetés, reconstitution de documents utilisés dans le domaine de l'enquête criminelle après avoir été détruits en morceaux, 1 article ;

10) Migration du style de texte, 1 article ;

11) Recherche sur les attaques contradictoires de reconnaissance de texte de scène, 1 article ;

12) Identification de l'écriture manuscrite, 1 article.

Il convient de mentionner que 10 des 16 articles sont open source ou sont sur le point de l'être. Merci à ces développeurs ~

Pour les articles qui ont été open source ou qui le seront bientôt, l'adresse du code est également jointe.

Tu peux aller à:

http://openaccess.thecvf.com/CVPR2020.py

Téléchargez ces articles par sujet.

Si vous souhaitez télécharger tous les articles CVPR 2020, veuillez cliquer ici :

Les articles du CVPR 2020 sont entièrement ouverts au téléchargement, y compris la réunion principale et l'atelier


  détection de texte de scène

Réseaux de graphiques de raisonnement relationnel profond pour la détection de textes de forme arbitraire

[1].Réseau de graphiques de raisonnement relationnel profond pour la détection de texte de forme arbitraire

Auteurs | Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, Xu-Cheng Yin

Unité | Université des sciences et technologies de Pékin ; Laboratoire commun de l'Université des sciences et technologies de Pékin ; Tencent Technology (Shenzhen)

Code |  https://github.com/GXYM/DRRG

Remarques | CVPR 2020 Oral

Interprétation |  https://blog.csdn.net/SpicyCoder/article/details/105072570

déposer

[2].ContourNet : faire un pas de plus vers une détection précise de texte de scène de forme arbitraire

Auteurs | Yuxin Wang, Hongtao Xie, Zheng-Jun Zha, Mengting Xing, Zilong Fu, Yongdong Zhang

Unité | Université des sciences et technologies de Chine

Code |  https://github.com/wangyuxin87/ContourNet

Interprétation |  https://zhuanlan.zhihu.com/p/135399747

déposer


  reconnaissance de texte de scène

Sur la dépendance lexicale dans la reconnaissance de texte de scène

[3].Sur le recours au vocabulaire dans la reconnaissance de texte de scène

Auteurs | Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao

Unité | Megvii ; Université chinoise des mines et de la technologie ; Université de Rochester

déposer

[4].SCATTER : Reconnaissance de texte de scène attentionnelle à contexte sélectif

ici | Ron Litman, Oron Anschel, Shahar Tsiper, Roee Litman, Shai Mazor, R. Manmatha

Unité | Amazon Web Services

déposer
Réseaux de raisonnement sémantique pour une reconnaissance précise du texte de la scène

[5].Vers une reconnaissance précise des textes de scène avec des réseaux de raisonnement sémantique

Auteurs | Deli Yu, Xuan Li, Chengquan Zhang, Tao Liu, Junyu Han, Jingtuo Liu, Errui Ding

Unité | Université nationale des sciences et technologies ; Baidu ; Académie chinoise des sciences

Code |  https://github.com/chenjun2hao/SRN.pytorch

déposer

Un cadre de codec sémantiquement amélioré pour reconnaître le texte de scène dans des images de mauvaise qualité (éclairage flou, inégal, caractères incomplets, etc.)

[6].SEED : Cadre d'encodeur-décodeur amélioré par sémantique pour la reconnaissance de texte de scène

Auteurs | Zhi Qiao, Yu Zhou, Dongbao Yang, Yucan Zhou, Weiping Wang

Unité | Académie chinoise des sciences ; Université nationale des sciences et technologies

Code |  https://github.com/Pay20Y/SEED (à venir )

déposer


  reconnaissance de texte manuscrit

[7].OrigamiNet : reconnaissance de texte d'une page complète, faiblement supervisée, sans segmentation, en une étape, en apprenant à se dérouler

Auteur | Mohamed Yousef, Tom E. Bishop

Unité | Intuition Machines, Inc.

Code |  https://github.com/IntuitionMachines/OrigamiNet

déposer

  Repérage du texte de la scène

Reconnaissance de texte de scène de bout en bout en temps réel

[8].ABCNet : détection de texte de scène en temps réel avec un réseau adaptatif de courbe de Bézier

Auteurs | Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang

Unité | Université de technologie de Chine du Sud ; Université d'Adélaïde ;

Code |  https://github.com/Yuliang-Liu/bezier\_curve\_text\_spotting

Remarques | CVPR 2020 Oral

Interprétation |  https://zhuanlan.zhihu.com/p/146276834

déposer


  génération de texte manuscrit

Génération de texte manuscrit semi-supervisé de longueur variable, augmentant les ensembles de données textuelles et améliorant la précision des algorithmes de reconnaissance

[9].ScrabbleGAN : génération de texte manuscrit semi-supervisé de longueur variable

ici | Sharon Fogel, Hadar Averbuch-Elor, Sarel Cohen, Shai Mazor, Roee Litman

Unités | État d'Israël, Amazon Rekognition ; Université Cornell

Code |  https://github.com/amzn/convolutional-handwriting-gan

déposer


  Synthèse de texte de scène

Utilisez le moteur de rendu pour synthétiser le texte de la scène, augmenter les échantillons d'entraînement et améliorer la précision des algorithmes de reconnaissance

[10].UnrealText : synthèse d'images de texte de scène réalistes à partir d'Unreal 

Auteur | MondeShangbang Long, Cong Yao

Unité | Université Carnegie Mellon ; Megvii

Code | https://jyouhou.github.io/UnrealText/

Interprétation |  https://zhuanlan.zhihu.com/p/137406773

déposer


  Augmentation des données + reconnaissance de texte

Augmentation d'image pour l'écriture manuscrite et la reconnaissance de texte de scène

[11].Apprenez à augmenter : augmentation conjointe des données et optimisation du réseau pour la reconnaissance de texte

Auteurs | Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang

Unité | Université de technologie de Chine du Sud ; Ali

Code |  https://github.com/Canjie-Luo/Text-Image-Augmentation

déposer


  éditeur de texte de scène

[12].STEFANN : Éditeur de texte de scène utilisant un réseau neuronal adaptatif de police

ici | Prasun Roy, Saumik Bhattacharya, Subhankar Ghosh, Umapada Pal

Unité | Institut indien de statistiques ; Institut indien de technologie

Code |  https://github.com/prasunroy/stefann

Site Web |  https://prasunroy.github.io/stefann/

déposer


  Reconstruction de documents déchiquetés

Reconstruction de documents à partir de papier déchiqueté pour des enquêtes médico-légales et autres enquêtes criminelles

[13].Reconstruction plus rapide de documents texte déchiquetés via un apprentissage métrique asymétrique profond auto-supervisé

ici | Thiago M. Paixao, Rodrigo F. Berriel, Maria CS Boeres, Alessandro L. Koerich, Claudine Badue, Alberto F. De Souza, Thiago Oliveira-Santos

Unité | IFES, Brésil ; UFES, Brésil ; ETS, Canada

déposer


  Transfert de style de texte

[14].SwapText : transfert de textes basés sur des images dans des scènes

Auteurs | Qiangpeng Yang, Jun Huang, Wei Lin

Unité | Ali

déposer


  Reconnaissance de texte de scène + attaque contradictoire

[15].Ce que voient les machines n'est pas ce qu'elles obtiennent : tromper les modèles de reconnaissance de texte de scène avec des images de texte contradictoires

Auteurs| Xing Xu, Jiefu Chen, Jinhui Xiao, Lianli Gao, Fumin Shen, Heng Tao Shen

Unité | Université des sciences et technologies électroniques de Chine

déposer


  identification de l'écriture manuscrite

[16].Profils de motifs séquentiels et tracés topologiques pour la vérification de signature hors ligne

ici | Elias N. Zois, Evangelos Zervas, Dimitrios Tsourounis, George Economou

Unité | Université de West Attica ; Université de Paturas

déposer

FIN


Source de l'article : CV original juin J'adore la vision par ordinateur @微信公司号

Je suppose que tu aimes

Origine blog.csdn.net/qq_36276587/article/details/111679890
conseillé
Classement