第四范式刷新ICDAR世界纪录

 

2019.5.24

 

近日,第四范式在世界OCR权威标准ICDAR数据集挑战赛中刷新了ICDAR2017多国语言场景文字检测任务的世界纪录,排名该项任务榜单世界第一。文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,其OCR数据集挑战赛是全球认可的最权威工业级黄金标准。

 

ICDAR作为世界级模式识别顶会,其每届OCR数据集挑战赛呈现的特点、难度和复杂性也随之增长。ICDAR 2013只是自然场景下的水平文字检测,随后在ICDAR2015和ICDAR2017中,数据集的难度不断增加,除了要在自然场景下完成文字检测,还增加了字体模糊、倾斜、背景干扰等复杂性和多样性识别难度,带来真实场景下的更大挑战。在ICDAR2017多国语言场景文字检测中,增加了中、日、韩、阿拉伯及西语等多国文字检测让挑战赛难度再次飙升,自然成为众多知名企业和高校团队试验技术成色的最佳试金石。

 

基于在OCR及CV领域的技术积淀及丰富的应用场景落地经验,面对ICDAR2017多国语言场景文字检测挑战,第四范式以Two Stage框架为基础,增加优化多国语言检测定位能力的同时,不断优化解决数据现实街拍场景中文字尺度、大小、倾斜角度以及光照影响等实际难题,特别是不同角度文字密集度上升带来的严重干扰问题,经过不断优化迭代后,在多国语言场景文字检测中占据世界第一位置。