图表读懂机器冠军比赛模式识别(图表机器数据比赛冠军)

近日，在由IEEE(电气和电子工程师协会)主办的ICPR（International Conference on Pattern Recognition）模式识别国际会议上，新华智云团队勇夺1项冠军和3项亚军。
Magic是新华智云参赛名该图表识别挑战赛共分六个赛道，包括图表分类、图表文字检测与识别、文字语义角色分类、坐标轴理解、图例分析和数据提取，基本涵盖机器识别理解图表的关键维度。
经过了激烈比赛，新华智云在在图例分析上取得冠军，在图表分类、图表文字检测与识别和文字语义角色分类上获得亚军，体现了新华智云在计算机视觉领域的积累和实力。
这是继国际计算机视觉大会（ICCV）视频综合理解挑战赛冠军，以及国际计算机视觉与模式识别会议(CVPR）视频五项全能挑战赛第三名后，新华智云再次在高级别国际大会上勇夺名次。
ICPR 2020 Competition on Harvesting Raw Tables from Infographics ，是由知名软件公司 Adobe 和纽约大学布法罗分校共同主办，旨在提供大规模数据以探索更加智能的图表数据提取算法。
在读图时代，一堆复杂数据，可以通过一张图表清晰呈现，所谓一图胜千言。
但对机器来说，处理数据容易，但理解图表传递的信息则是挑战。
如果说“数据可视化”是将数据翻译为图表，那么这场比赛就是让机器对图表进行“逆向”翻译。
比赛待识别图片为体现挑战性，每场比赛都设置了技术关卡。
例如在图表文字检测与识别比赛中，不仅存在多行文本，而且文本走向各不相同，还穿插了多种特殊符号，给机器识别增加了不小的难度。
在图例分析比赛中，图例尺寸远小于一般物体，同时在折线图中，图例也都一条线，这些肉眼很容易找到的目标，对于机器却难以准确定位，针对小目标检测的传统技术此时基本失效。
回忆比赛时，新华智云人工智能专家王辰表示，“图表由丰富的视觉信息和文本信息组成，提取并利用这些多模态信息，是提取图表数据的关键。
在比赛中，我们通过多种创新手段，大幅提高了模型表现。
”谈及新华智云积累计算机视觉技术的目的，作为媒体融合国家重点实验室学术带头人，新华智云联席CEO徐常亮指出，新华智云的重要使命就是研发视频自动化生产系统，计算机视觉技术的发展，让数据新闻的自动生产成为可能。
“未来，静态图表可能自动被转化成动态视频，还可以通过不同类型的图表，对数据进行多元展示分析”，徐常亮说，“对于用户来说，只需输入多张图片，机器就能智能识别图片中数据，进而对应到匹配的数据视频模板，转换为具有故事性的短视频。
如果再配合智能语音解说，就能自动产出一条高质量数据新闻短视频。
”