一个 2 秒命中的工具,和它教我的反直觉的事
我做完一个 70% 命中、2 秒出结果的工具,然后看着它没人用。问题不在工具。
做工具的人几乎都信一条:功能够强、够准,大家自然会用。我做过一个 70% 命中、2 秒出结果的工具,然后眼睁睁看着它几乎没人用——问题根本不在工具。
那工具叫「拍照识别货号」。直播间和仓库现场用的,同事对着一件货拍张照,2 秒查到货号。后面是一套我自己挺得意的四段式工作流,我管它叫「文字定范围,图片精排序」:先用视觉模型读懂同事那句口语描述(哪个店、什么品类、怎么戴),数据库筛出候选,图像相似度搜索精排,最后大模型视觉复核一遍。167 次真实使用反馈下来,第一名命中率 70%。
我当时心里是有底气的。这个准头,这个速度,在现场够用了。
然后它就躺在那儿没人用
我盯了一阵子数据,才看明白一件特别打脸的事。
工具的能力是完整的。但同事真要走完一次,得三步:手机拍照、把照片发到微信或飞书、再从飞书把那张图拖进网页里。
三步。
第三步,你想想现场。那么忙,手里还攥着货,一个人凭什么会专门去打开一个网页、再把图拖进去?大多数情况下,第三步根本不会发生。功能再准,它都卡在那一步前面,等不到被用上。
不是「工具不够好」,是「工具住在了错的地方」。
想通这句话那一下,我有点想笑。我花了那么多力气抠那 70% 的命中率,结果决定生死的,压根不是命中率。
入口位置,是战略选型,不是技术选型
一个独立网页,意味着同事得「主动想起来」才会打开。靠记性驱动的工具,使用率约等于零。
同一个工具,如果做进飞书小程序呢?它就住进了同事一天打开 50 次的那个 App 里。不用想起来,它就在手边。使用率,天差地别。
所以「把工具做进飞书」,听起来像个技术决定——其实是个战略决定。我选的不是技术栈,我选的是这个工具住在哪里。入口位置才是真正要较真的那一关。
这跟我另一个判断是同一个根。我做 AI 项目,一直认死一条:要在源头介入。数据要在数据的源头介入,工具要在用户行为的源头——也就是同事每天活跃的那个 App——介入。在出口装插件、在末端补救,我试过,基本都失败。流程的尽头,你再聪明都晚了。
还有一层我越来越确定:这工具真正动人的地方,不是它「看懂」了一张图。你上传一张图问「这是什么」,那是看;它直接把现场卡住的那 2 秒接管掉,那是帮。而帮成不成立,第一道坎不在模型,在它有没有住进你伸手就够得到的地方。
现在我做任何一个内部工具,第一个问的不再是「它准不准」,是「它住在哪、同事走到它面前要几步」。能砍到一步,我才敢往下做。真做一版飞书的,我盯着的就是它能不能把那三步砍到一步——这事我还在试。