第(1/3)页 第二天,贾瀞雯飞往杭州。 到横店时是下午,陈浩在别墅等她。 合同放在书房桌上,厚厚一沓。 贾瀞雯仔细看了一遍,确认条款没问题,签了字。 “这批服务器到位后,我们的存储容量能翻三倍。”她把合同收好,“够用半年了。” “半年后还会不够的。”陈浩笑着递给她一杯红酒,“互联网在膨胀,我们的胃口也得跟着涨。” 两人在客厅坐下。 窗外天色渐暗,屋里开了暖黄色的灯。 “为百度干杯。”陈浩举杯。 “为团队干杯。”贾瀞雯和他碰杯。 红酒口感醇厚,带着果香。 贾瀞雯喝了一小口,放松地靠在沙发上。 “这段时间,我一直在想一个问题。”陈浩忽然说。 “什么?” “搜索怎么才能更懂中文。”陈浩放下杯子,“不是技术上的懂,是语义上的懂。 比如用户搜‘苹果’,我们怎么知道他是要找水果,还是找电脑,还是找电影?” 贾瀞雯思考着:“现在我们是靠关键词匹配和超链分析。 但确实,深层的语义理解还做不到。” “中文太复杂了。”陈浩说,“同一个词,不同语境意思完全不同。 ‘我跟他有点过节’,这里的‘过节’不是节日,是矛盾。 ‘这篇文章很有味道’,‘味道’不是气味,是趣味。 这些,现在的搜索引擎都理解不了。” “那怎么办?” “需要自然语言处理。”陈浩说,“让计算机理解中文的语法、语义、语境。 这很难,需要大量研究,可能需要好几年。 但这是方向——搜索最终要做的,不是匹配关键词,是理解用户的意图。” 贾瀞雯认真听着。 陈浩总是想得很远。 “这需要语言学专家参与。”她说,“还要建语料库,训练模型。” “对。”陈浩点头,“所以下一步,我们要开始筹建研究团队。 不只是工程师,还要有语言学家,有算法科学家。 这条路很长,但现在就要开始铺。” 两人又聊了很久。 从技术聊到市场,从产品聊到团队。 红酒喝了一杯又一杯,话也越说越开。 说到后来,贾瀞雯有点微醺。 第(1/3)页