齐凡和王教授师徒二人从张副校长办公室出来。
“老师,车牌图片他能弄到吗。那可不是一两千张就够的,模型如饕餮,一两万张都嫌少。”
王教授笑了笑,“你和我关注的点倒是不同。我是担心算法行不行,你倒在担心样本数据够不够。”
“算法应该不会有问题。”
“哦?车牌识别可涉及到汉字识别,而且实际应用场景对错误率的要求,可不是比赛能比的。”
“比赛上5%的错误率就已经是遥遥领先,可放到实际应用中,5%就是个笑话。”
齐凡明白,王教授说的没错。要是车牌识别出现5%的错误率,那以整个金陵城为例,一天下来就要出现N起识别错误引发的纠纷,这绝对无法接受的。因而别说是5%,就算是1%也不行。
“我知道,实际应用时,1%的错误率都是无法接受的。哪怕是千分之一都是不行的。因为无人停车场的本意是减少人力开销来获取经济效益,但以千分之一的错误率来计算。一辆汽车进出至少识别两次,那也就是说每五百辆汽车就会有一辆出现识别错误。”
“而金陵城绝大部分的停车场周末的客流都在几千辆汽车。这就会让停车场仍旧需要派个人手驻守,那无人停车场也就名存实亡。所以,这识别错误率怎么也得到万级才行。”
“你明白就好。不过也别给自己太大压力,张副校长有他自己的考虑,你还是按你自己的节奏来就是了。”
王教授本是想安慰齐凡不要气馁,可不曾想齐凡却很有信心。
“我想试一试,如果数据样本能超过十万张的话,我有很大的信心。”
“好,初生牛犊不怕虎。数据样本的事情你放心。”
齐凡好奇道,“那可涉及大量的**问题。如此大规模的数据采集,真的没问题吗?”
王教授哈哈一笑,“那你以为大量的数据是怎么采集的。真的跑到人家跟前,征询对方同意吗。”
眼见齐凡很惊讶,王教授又道,“你还年轻。纵观国内外,哪个地方不是这么干的。”
“那,那具体会怎么操作。”
“金陵各大停车场肯定都会保存一段时间的图片数据,让他们自动交上来就是了。还有,你搞模型训练的话。应该只有无人停车场的照片才有价值。我待会儿和张副校长说下,只要那一部分就行了。”
齐凡立即补充道,“按照salcon等公司的客户条款,一旦照片使用他们的算法处理,默认将版权授予给salcon公司。也就是说使用方无权分发这些图片。”
王教授停下脚步看着齐凡,“听说一个故事吗?”
“什么?”