(图片来源网络,侵删)
近日,在由IEEE(电气和电子工程师协会)主办的ICPR(International Conference on Pattern Recognition)模式识别国际会议上,新华智云团队勇夺1项冠军和3项亚军。Magic是新华智云参赛名该图表识别挑战赛共分六个赛道,包括图表分类、图表文字检测与识别、文字语义角色分类、坐标轴理解、图例分析和数据提取,基本涵盖机器识别理解图表的关键维度。经过了激烈比赛,新华智云在在图例分析上取得冠军,在图表分类、图表文字检测与识别和文字语义角色分类上获得亚军,体现了新华智云在计算机视觉领域的积累和实力。这是继国际计算机视觉大会(ICCV)视频综合理解挑战赛冠军,以及国际计算机视觉与模式识别会议(CVPR)视频五项全能挑战赛第三名后,新华智云再次在高级别国际大会上勇夺名次。ICPR 2020 Competition on Harvesting Raw Tables from Infographics ,是由知名软件公司 Adobe 和纽约大学布法罗分校共同主办,旨在提供大规模数据以探索更加智能的图表数据提取算法。在读图时代,一堆复杂数据,可以通过一张图表清晰呈现,所谓一图胜千言。但对机器来说,处理数据容易,但理解图表传递的信息则是挑战。如果说“数据可视化”是将数据翻译为图表,那么这场比赛就是让机器对图表进行“逆向”翻译。比赛待识别图片为体现挑战性,每场比赛都设置了技术关卡。例如在图表文字检测与识别比赛中,不仅存在多行文本,而且文本走向各不相同,还穿插了多种特殊符号,给机器识别增加了不小的难度。在图例分析比赛中,图例尺寸远小于一般物体,同时在折线图中,图例也都一条线,这些肉眼很容易找到的目标,对于机器却难以准确定位,针对小目标检测的传统技术此时基本失效。回忆比赛时,新华智云人工智能专家王辰表示,“图表由丰富的视觉信息和文本信息组成,提取并利用这些多模态信息,是提取图表数据的关键。在比赛中,我们通过多种创新手段,大幅提高了模型表现。”谈及新华智云积累计算机视觉技术的目的,作为媒体融合国家重点实验室学术带头人,新华智云联席CEO徐常亮指出,新华智云的重要使命就是研发视频自动化生产系统,计算机视觉技术的发展,让数据新闻的自动生产成为可能。“未来,静态图表可能自动被转化成动态视频,还可以通过不同类型的图表,对数据进行多元展示分析”,徐常亮说,“对于用户来说,只需输入多张图片,机器就能智能识别图片中数据,进而对应到匹配的数据视频模板,转换为具有故事性的短视频。如果再配合智能语音解说,就能自动产出一条高质量数据新闻短视频。”
0 评论