第1801章技术深水区

周一的技术战略会上，贾瀞雯在白板上写下四个字：图像搜索。

会议室里安静了几秒。

然后响起一阵低低的议论声。

“图像搜索？”李明重复了一遍，“用户上传图片，然后我们找相似的图片？”

“对。”贾瀞雯点头，“技术上叫基于内容的图像检索。

国外有实验室在研究，但还没有成熟的产品。”

张涛推了推眼镜：“贾总，这个……太超前了吧？我们现在连文字搜索都还没做到完美。

图像搜索的复杂度要高几个数量级。”

“我知道难。”贾瀞雯说，“但搜索的未来不只是文字。

图片、声音、视频，这些都是信息。

如果我们现在不开始研究，等别人做出来了，我们就落后了。”

王磊举手：“技术上具体要做什么？”

“分几个部分。”贾瀞雯在白板上画图，“第一，特征提取。

从图片里提取颜色、纹理、形状等特征。

第二，特征索引。

把这些特征建成可搜索的数据库。

第三，相似度匹配。

用户上传图片后，计算和库中图片的相似度，返回最接近的结果。”

她画完，看向团队。

大多数人都皱着眉头。

“这需要计算机视觉的专业知识。”新来的一个算法工程师说，“我们团队没人懂这个领域。”

“需要大量的计算资源。”另一个工程师补充，“图片特征提取很耗CPU，匹配算法也很复杂。

现在的服务器可能扛不住。”

“还有数据问题。”李明说，“我们需要海量的图片数据来训练和测试。

去哪找这么多图片？”

质疑声一个接一个。

贾瀞雯安静地听着，等大家都说完了，她才开口。

“所有的困难我都知道。”她说，“但陈总说了，有些事现在不做，以后就晚了。

图像搜索是未来，我们必须现在开始布局。”

她顿了顿：“当然，不是要马上做出产品。

我们先做预研，探索技术可行性。

周期定六个月，投入资源控制在可接受范围内。

这样可以吗？”

团队互相看了看，最终都点了头。

但贾瀞雯能看出来，大部分人心里还是没底。

会后，她给陈浩打电话汇报情况。

“团队反应怎么样？”陈浩问。

“有疑虑。”贾瀞雯实话实说，“觉得太超前，技术难度太大。”

“正常。”陈浩说，“新技术的探索总是这样。

我等会儿发你一些资料，是国外论文和研究报告。

你让团队先学习，有个概念。”

半小时后，邮箱里多了十几封邮件。

附件全是PDF，英文的，有些还有复杂的数学公式。

贾瀞雯打印出来，厚厚一摞。

她抱着这摞资料回到会议室，团队还在讨论。

“这是陈总发的资料。”她把资料放在桌上，“大家先看看，了解下这个领域的前沿进展。”

李明拿起一份，翻了翻，眼睛渐渐亮起来。

“这篇论文……讲的是基于颜色直方图的图像匹配。

思路挺巧妙的。”

张涛也拿起一份：“这个是纹理特征提取的方法，用到了小波变换。”

新来的算法工程师看着一篇论文，喃喃自语：“这个相似度度量公式……有点意思。”

资料起了作用。

团队开始认真研究，会议室里响起了讨论声。

但一周后，问题又来了。

“贾总，我们试了几个经典算法。”李明汇报，“效果……不太好。

简单的图片能匹配，稍微复杂点就乱了。”

“具体什么问题？”

“特征不够鲁棒。”张涛解释，“同一辆汽车，不同角度拍，提取的特征差异很大。

算法认不出来是同一个东西。”

贾瀞雯思考着。

这时，陈浩的电话来了。

“进展如何？”他问。

贾瀞雯把问题说了。

陈浩听完，没直接给答案，而是问：“你们现在怎么做的？”

“按论文里的方法，先做整体特征提取，再做全局匹配。”

“换个思路。”陈浩说，“分阶段实现。

第一阶段，不做通用图像搜索，先做特定类别的识别。

比如先做汽车识别，因为汽车有比较固定的特征。

第二阶段，扩展到建筑、动物等常见类别。

第三阶段，再做通用搜索。”

贾瀞雯记下来：“这是技术路径上的建议？”

“对。”陈浩说，“另外，方法上也可以调整。

不要追求完美算法，先用简单方法验证可行性。

小步快跑，快速试错。”

挂了电话，贾瀞雯立刻召集团队。

“调整策略。”她说，“我们不分阶段：第一阶段，选定十个常见物品类别——汽车、建筑、动物、植物、家具、电器、服装、食品、书籍、艺术品。

第二阶段，每个类别做专门的识别模型。

第三阶段，整合成原型系统。”

她看向李明：“方法上，先用最简单的特征——颜色和纹理。

效果不好再升级。

目标不是完美，是验证可行性。”

团队重新分工。

十个人，每人负责一个类别。

贾瀞雯要求每周汇报进展，遇到问题随时讨论。

第一周，进展缓慢。

负责汽车识别的工程师发现，不同颜色的汽车在颜色特征上差异太大。

负责动物识别的发现，猫和狗在某些角度下很难区分。

第二周，有人想出了新办法。

负责建筑的工程师提议，用边缘检测提取轮廓特征，因为建筑有清晰的几何形状。

这个思路在其他类别也适用。

第三周，团队开始分享经验。

汽车组借鉴了建筑组的轮廓方法，动物组结合了颜色和纹理特征。

小步快跑的策略见效了。

虽然每个类别只能做到百分之六七十的准确率，但至少能跑了。

第四周，贾瀞雯组织了一次内部演示。

每个小组展示自己的成果。

汽车组：能识别轿车、SUV、卡车等大类，但细分车型还有困难。

建筑组：能区分现代建筑和古典建筑，但具体风格识别不准。

动物组：能区分猫、狗、鸟等大类，但具体品种分不清。

演示完，贾瀞雯总结：“虽然不完美，但证明了这条路能走通。

下个月的目标：提高每个类别的准确率，同时开始做系统整合。”

【跪求礼物，免费的为爱发电也行！】

　　(https://www.wshuw.net/2797/2797245/40297903.html)

1秒记住万书网：www.wshuw.net。手机版阅读网址：m.wshuw.net

第1801章 技术深水区

第1801章技术深水区