周一的技术战略会上,贾瀞雯在白板上写下四个字:图像搜索。
会议室里安静了几秒。
然后响起一阵低低的议论声。
“图像搜索?”李明重复了一遍,“用户上传图片,然后我们找相似的图片?”
“对。”贾瀞雯点头,“技术上叫基于内容的图像检索。
国外有实验室在研究,但还没有成熟的产品。”
张涛推了推眼镜:“贾总,这个……太超前了吧?我们现在连文字搜索都还没做到完美。
图像搜索的复杂度要高几个数量级。”
“我知道难。”贾瀞雯说,“但搜索的未来不只是文字。
图片、声音、视频,这些都是信息。
如果我们现在不开始研究,等别人做出来了,我们就落后了。”
王磊举手:“技术上具体要做什么?”
“分几个部分。”贾瀞雯在白板上画图,“第一,特征提取。
从图片里提取颜色、纹理、形状等特征。
第二,特征索引。
把这些特征建成可搜索的数据库。
第三,相似度匹配。
用户上传图片后,计算和库中图片的相似度,返回最接近的结果。”
她画完,看向团队。
大多数人都皱着眉头。
“这需要计算机视觉的专业知识。”新来的一个算法工程师说,“我们团队没人懂这个领域。”
“需要大量的计算资源。”另一个工程师补充,“图片特征提取很耗CPU,匹配算法也很复杂。
现在的服务器可能扛不住。”
“还有数据问题。”李明说,“我们需要海量的图片数据来训练和测试。
去哪找这么多图片?”
质疑声一个接一个。
贾瀞雯安静地听着,等大家都说完了,她才开口。
“所有的困难我都知道。”她说,“但陈总说了,有些事现在不做,以后就晚了。
图像搜索是未来,我们必须现在开始布局。”
她顿了顿:“当然,不是要马上做出产品。
我们先做预研,探索技术可行性。
周期定六个月,投入资源控制在可接受范围内。
这样可以吗?”
团队互相看了看,最终都点了头。
但贾瀞雯能看出来,大部分人心里还是没底。
会后,她给陈浩打电话汇报情况。
“团队反应怎么样?”陈浩问。
“有疑虑。”贾瀞雯实话实说,“觉得太超前,技术难度太大。”
“正常。”陈浩说,“新技术的探索总是这样。
我等会儿发你一些资料,是国外论文和研究报告。
你让团队先学习,有个概念。”
半小时后,邮箱里多了十几封邮件。
附件全是PDF,英文的,有些还有复杂的数学公式。
贾瀞雯打印出来,厚厚一摞。
她抱着这摞资料回到会议室,团队还在讨论。
“这是陈总发的资料。”她把资料放在桌上,“大家先看看,了解下这个领域的前沿进展。”
李明拿起一份,翻了翻,眼睛渐渐亮起来。
“这篇论文……讲的是基于颜色直方图的图像匹配。
思路挺巧妙的。”
张涛也拿起一份:“这个是纹理特征提取的方法,用到了小波变换。”
新来的算法工程师看着一篇论文,喃喃自语:“这个相似度度量公式……有点意思。”
资料起了作用。
团队开始认真研究,会议室里响起了讨论声。
但一周后,问题又来了。
“贾总,我们试了几个经典算法。”李明汇报,“效果……不太好。
简单的图片能匹配,稍微复杂点就乱了。”
“具体什么问题?”
“特征不够鲁棒。”张涛解释,“同一辆汽车,不同角度拍,提取的特征差异很大。
算法认不出来是同一个东西。”
贾瀞雯思考着。
这时,陈浩的电话来了。
“进展如何?”他问。
贾瀞雯把问题说了。
陈浩听完,没直接给答案,而是问:“你们现在怎么做的?”
“按论文里的方法,先做整体特征提取,再做全局匹配。”
“换个思路。”陈浩说,“分阶段实现。
第一阶段,不做通用图像搜索,先做特定类别的识别。
比如先做汽车识别,因为汽车有比较固定的特征。
第二阶段,扩展到建筑、动物等常见类别。
第三阶段,再做通用搜索。”
贾瀞雯记下来:“这是技术路径上的建议?”
“对。”陈浩说,“另外,方法上也可以调整。
不要追求完美算法,先用简单方法验证可行性。
小步快跑,快速试错。”
挂了电话,贾瀞雯立刻召集团队。
“调整策略。”她说,“我们不分阶段:第一阶段,选定十个常见物品类别——汽车、建筑、动物、植物、家具、电器、服装、食品、书籍、艺术品。
第二阶段,每个类别做专门的识别模型。
第三阶段,整合成原型系统。”
她看向李明:“方法上,先用最简单的特征——颜色和纹理。
效果不好再升级。
目标不是完美,是验证可行性。”
团队重新分工。
十个人,每人负责一个类别。
贾瀞雯要求每周汇报进展,遇到问题随时讨论。
第一周,进展缓慢。
负责汽车识别的工程师发现,不同颜色的汽车在颜色特征上差异太大。
负责动物识别的发现,猫和狗在某些角度下很难区分。
第二周,有人想出了新办法。
负责建筑的工程师提议,用边缘检测提取轮廓特征,因为建筑有清晰的几何形状。
这个思路在其他类别也适用。
第三周,团队开始分享经验。
汽车组借鉴了建筑组的轮廓方法,动物组结合了颜色和纹理特征。
小步快跑的策略见效了。
虽然每个类别只能做到百分之六七十的准确率,但至少能跑了。
第四周,贾瀞雯组织了一次内部演示。
每个小组展示自己的成果。
汽车组:能识别轿车、SUV、卡车等大类,但细分车型还有困难。
建筑组:能区分现代建筑和古典建筑,但具体风格识别不准。
动物组:能区分猫、狗、鸟等大类,但具体品种分不清。
演示完,贾瀞雯总结:“虽然不完美,但证明了这条路能走通。
下个月的目标:提高每个类别的准确率,同时开始做系统整合。”
【跪求礼物,免费的为爱发电也行!】