第1801章 技术深水区


周一的技术战略会上,贾瀞雯在白板上写下四个字:图像搜索。

会议室里安静了几秒。

然后响起一阵低低的议论声。

“图像搜索?”李明重复了一遍,“用户上传图片,然后我们找相似的图片?”

“对。”贾瀞雯点头,“技术上叫基于内容的图像检索。

国外有实验室在研究,但还没有成熟的产品。”

张涛推了推眼镜:“贾总,这个……太超前了吧?我们现在连文字搜索都还没做到完美。

图像搜索的复杂度要高几个数量级。”

“我知道难。”贾瀞雯说,“但搜索的未来不只是文字。

图片、声音、视频,这些都是信息。

如果我们现在不开始研究,等别人做出来了,我们就落后了。”

王磊举手:“技术上具体要做什么?”

“分几个部分。”贾瀞雯在白板上画图,“第一,特征提取。

从图片里提取颜色、纹理、形状等特征。

第二,特征索引。

把这些特征建成可搜索的数据库。

第三,相似度匹配。

用户上传图片后,计算和库中图片的相似度,返回最接近的结果。”

她画完,看向团队。

大多数人都皱着眉头。

“这需要计算机视觉的专业知识。”新来的一个算法工程师说,“我们团队没人懂这个领域。”

“需要大量的计算资源。”另一个工程师补充,“图片特征提取很耗CPU,匹配算法也很复杂。

现在的服务器可能扛不住。”

“还有数据问题。”李明说,“我们需要海量的图片数据来训练和测试。

去哪找这么多图片?”

质疑声一个接一个。

贾瀞雯安静地听着,等大家都说完了,她才开口。

“所有的困难我都知道。”她说,“但陈总说了,有些事现在不做,以后就晚了。

图像搜索是未来,我们必须现在开始布局。”

她顿了顿:“当然,不是要马上做出产品。

我们先做预研,探索技术可行性。

周期定六个月,投入资源控制在可接受范围内。

这样可以吗?”

团队互相看了看,最终都点了头。

但贾瀞雯能看出来,大部分人心里还是没底。

会后,她给陈浩打电话汇报情况。

“团队反应怎么样?”陈浩问。

“有疑虑。”贾瀞雯实话实说,“觉得太超前,技术难度太大。”

“正常。”陈浩说,“新技术的探索总是这样。

我等会儿发你一些资料,是国外论文和研究报告。

你让团队先学习,有个概念。”

半小时后,邮箱里多了十几封邮件。

附件全是PDF,英文的,有些还有复杂的数学公式。

贾瀞雯打印出来,厚厚一摞。

她抱着这摞资料回到会议室,团队还在讨论。

“这是陈总发的资料。”她把资料放在桌上,“大家先看看,了解下这个领域的前沿进展。”

李明拿起一份,翻了翻,眼睛渐渐亮起来。

“这篇论文……讲的是基于颜色直方图的图像匹配。

思路挺巧妙的。”

张涛也拿起一份:“这个是纹理特征提取的方法,用到了小波变换。”

新来的算法工程师看着一篇论文,喃喃自语:“这个相似度度量公式……有点意思。”

资料起了作用。

团队开始认真研究,会议室里响起了讨论声。

但一周后,问题又来了。

“贾总,我们试了几个经典算法。”李明汇报,“效果……不太好。

简单的图片能匹配,稍微复杂点就乱了。”

“具体什么问题?”

“特征不够鲁棒。”张涛解释,“同一辆汽车,不同角度拍,提取的特征差异很大。

算法认不出来是同一个东西。”

贾瀞雯思考着。

这时,陈浩的电话来了。

“进展如何?”他问。

贾瀞雯把问题说了。

陈浩听完,没直接给答案,而是问:“你们现在怎么做的?”

“按论文里的方法,先做整体特征提取,再做全局匹配。”

“换个思路。”陈浩说,“分阶段实现。

第一阶段,不做通用图像搜索,先做特定类别的识别。

比如先做汽车识别,因为汽车有比较固定的特征。

第二阶段,扩展到建筑、动物等常见类别。

第三阶段,再做通用搜索。”

贾瀞雯记下来:“这是技术路径上的建议?”

“对。”陈浩说,“另外,方法上也可以调整。

不要追求完美算法,先用简单方法验证可行性。

小步快跑,快速试错。”

挂了电话,贾瀞雯立刻召集团队。

“调整策略。”她说,“我们不分阶段:第一阶段,选定十个常见物品类别——汽车、建筑、动物、植物、家具、电器、服装、食品、书籍、艺术品。

第二阶段,每个类别做专门的识别模型。

第三阶段,整合成原型系统。”

她看向李明:“方法上,先用最简单的特征——颜色和纹理。

效果不好再升级。

目标不是完美,是验证可行性。”

团队重新分工。

十个人,每人负责一个类别。

贾瀞雯要求每周汇报进展,遇到问题随时讨论。

第一周,进展缓慢。

负责汽车识别的工程师发现,不同颜色的汽车在颜色特征上差异太大。

负责动物识别的发现,猫和狗在某些角度下很难区分。

第二周,有人想出了新办法。

负责建筑的工程师提议,用边缘检测提取轮廓特征,因为建筑有清晰的几何形状。

这个思路在其他类别也适用。

第三周,团队开始分享经验。

汽车组借鉴了建筑组的轮廓方法,动物组结合了颜色和纹理特征。

小步快跑的策略见效了。

虽然每个类别只能做到百分之六七十的准确率,但至少能跑了。

第四周,贾瀞雯组织了一次内部演示。

每个小组展示自己的成果。

汽车组:能识别轿车、SUV、卡车等大类,但细分车型还有困难。

建筑组:能区分现代建筑和古典建筑,但具体风格识别不准。

动物组:能区分猫、狗、鸟等大类,但具体品种分不清。

演示完,贾瀞雯总结:“虽然不完美,但证明了这条路能走通。

下个月的目标:提高每个类别的准确率,同时开始做系统整合。”

【跪求礼物,免费的为爱发电也行!】


  (https://www.wshuw.net/2797/2797245/40297903.html)


1秒记住万书网:www.wshuw.net。手机版阅读网址:m.wshuw.net