计算机视觉:给机器装上一双慧眼

2018-02-26 08:44:17来源:青岛晚报

原标题:给机器装上一双慧眼

\

如果问现如今什么行业最火,想必不少人的答案是AI,而在AI这蓝海中,“计算机视觉”方向则是最为抢眼领域之一。青岛一家名为日山智能的公司,专注于机器学习与计算机视觉人工智能,在短短三年内,完成了新技术的探索和开发,团队已经服务于医疗、电力、能源、机场等10个项目,客单价在百万元级别。

创始人孙宇是地道的海归,从北京带领十多人的创业团队来青。他们避开大公司锋芒,尽可能和基础设施行业的“偏门”需求打交道。面对行业大客户,他们提供软硬件一体的定制化人工智能解决方案,面对细分领域客户,团队提供标准化产品。

创业者孙宇(中)和团队。

留学时产生浓厚兴趣

“人工智能不应是束之高阁的实验室项目,而应是人人可用的基础设施。”这是孙宇对AI的认知,他一直强调,未来几年AI将会大爆发。

孙宇是南京人,曾在加拿大一所大学读大二时,就对计算机视觉颇为感兴趣。当时想创业的他,由于经常帮亲朋好友代购,因此最初自己曾想以海淘作为创业首选方向。如何切入?孙宇和两位发小想到了图像搜索引擎。

受到语言障碍的制约,国内不少人难以读懂海外购物网站,更别提精准识别上百种分类标签和琳琅满目的产品。孙宇认为,如果能利用图像识别,将商品图片按照颜色、类型等标签归档后,人们只需将想要购买的商品图片拖入搜索引擎,便可定位至正确的商品购买页面。

这其中的关键技术是机器视觉和深度学习。孙宇从初中开始便一直接触并学习编程,但当时他认为“机器深度学习、神经网络之类的东西不靠谱”,上了三年大学之后,孙宇的认知发生了转变。 2010年,孙宇所在的计算机系并未开设本科相关课程,并且学校更侧重于数学理论基础教学而非计算机的实际应用。

于是,还在大三的孙宇走上了机器视觉和深度学习的自学道路。大学一毕业,孙宇便回国在南京创建了团队,誓言将自己的想法变为现实,一年后,团队所研发的图像搜索准确率为97%。团队本想将C端户行为数据卖掉以此获得收益,但是接触了几十家国内客户,却发现他们这方面的需求并不强烈。

电力行业打开突破口

市场不认可就要转型。结合团队在计算机视觉和深度学习方面的经验,同时参考“十三五”规划,孙宇确定了电力行业的需求。并以此为突破口,开始把深度学习和AI在各个行业进行试验,一年时间内,孙宇团队甚至在5个不同行业进行AI实验。

当时,电力设备线路检查正逐步由无人机替代人,但是依然需要人工对无人机拍摄的视频和图片进行检查。在任务繁重、人员短缺、图像不稳定的情况下,工作质量和效率都难以保证。

孙宇团队对电网照片与视频进行分类检测和归档,直接抓取兴趣分类中的高清图片,可以自动识别施工车辆、堆土等外力破坏。同时,其技术还支持对铁塔上的缺陷进行检测识别、归档,比如铆钉生锈缺失、电网组建损毁等,并生成报告。

这些需求不是团队凭空想象,而是与行业人士不断沟通、深入企业观察日常工作、活动行为等总结形成。按照这样的“套路”,团队开始接触其他行业,遵循可复制、客户需求明显等标准,团队带着他们的图像视频识别技术,连续进入了医疗、无人机、能源、机场能行业,提供了造影识别、人工操作规范识别、无人机对目标物自主搜索等功能,平均每个项目的运作周期为两个月。“避大公司锋芒,尽可能和基础设施行业的‘偏门’需求打交道。 ”孙宇说,“先做外包,活得更好一些,才可能脱离外包。 ”就是在这样“外包”事务中,孙宇有了一个明确的想法,要让人人都有权利和能力使用人工智能。

在青岛走上创业快车道

目前,孙宇带领团队来到青岛,拿到了众多优惠的创业政策。在团队看来,其视频图像智能识别和分析技术不是仅能用于科技、金融、工业等领域,畜牧养殖、宠物饲养等各个领域都可以运用。比如,人们可以利用视频分析技术,对监控小猫活动的视频进行分析,看它打喷嚏的次数判断其是否感冒,或者日常活动频率分析其是否情绪低落等。

为了实现“人人可用”的目标,团队将其机器学习与计算机视觉分析产品不断标准化,用户只需导入相同场景的视频,然后标出他想识别的物体或者动作路径等,机器就能自动学习,准确率基本可在95%以上。比如,在安防领域只需标注100段打架的行为动作,机器学习之后会自主对其他视频的打架行为进行判断。

“让人工智能遍地开花就是我们未来业务发展的方向。 ”孙宇说,目前,团队已服务了10家客户,客单价百万元级别。下一步,他们更希望能拿到投资,备足粮草继续前行。

青岛晚报/掌上青岛/青网 记者 薛飞

分享到: