论文部分内容阅读
毕业于哈尔滨工业大学计算机科学与技术学院的赵世奇,是百度博士后工作站成立以来的第一名博士后,到2010年底,赵世奇已经在百度工作了一整年。赵世奇对自己一年来的发展评价是“超出预期”,然而,最让赵世奇感到骄傲的,是他作为百度博士后的身份,让他获得了参与探索前沿搜索技术的机会。
探索搜索前沿技术
“下一代搜索引擎究竟应该是什么样子的?”自搜索引擎诞生之日起,业界对这个问题的探讨从未停歇,而随着互联网信息不断丰富,这个话题也越来越受到关注。
尽管“让机器读懂人的思想”是多年来业界和学术界一直努力的方向,但是实现起来却并非易事。“举例来说,”赵世奇告诉记者,“最近很多人在百度上搜索‘给力的歌曲’,希望能得到相应的答案。如果是我问你,你可能会推荐一首最近听过的好歌。但是,怎样能让计算机理解什么叫‘给力’,并且识别出什么樣的歌曲是‘给力的歌曲’,这个问题就很值得探索。”实现人与搜索引擎之间更有效的沟通,已经成为百度“自然语言处理(NLP)部”最核心的工作任务。简而言之,就是深入理解用户的需求和互联网上的信息,并将两者精准匹配。
作为百度自然语言处理部的主要成员之一,赵世奇对他所从事的前沿探索——语义搜索——有着自己的见解。他认为“所谓语义搜索,是指基于语义分析和用户行为分析等技术,对各类资源和服务进行智能调度,从而更好地满足用户需求的搜索。”具体地,语义搜索的定义应体现在两个层面:首先,在功能层面,语义搜索体现为对用户查询和互联网数据的“深入理解”;其次,在技术层面,语义搜索体现为对多种搜索技术和自然语言处理技术的综合应用。早在2009年,百度CEO李彦宏就创造性地提出了“框计算”理念。框计算是一种简单可依赖的互联网需求交互模式,用户只要在框中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的应用或内容资源提供商处理,最终返回给用户相匹配的结果。
根据赵世奇的理解,“语义搜索”是框计算理念得以实现的重要技术保证,而“语义搜索”未来的重点可能包括“查询的深入理解”和“资源的精细加工”。
如果只是一个技术研发者,赵世奇可能会期待“语义搜索”技术对搜索引擎带来颠覆性的影响,但作为服务4.5亿网民的全球最大中文搜索引擎公司的一员,他早已经学会更多地从用户体验角度来思考这个问题。“在百度的工作让我明白,再炫的技术,最终是为提升用户体验服务的”,所以赵世奇现在常提醒自己,要在理论研究和应用实践间找到恰当的平衡点。
超出预期的成长
赵世奇所在的自然语言处理团队,就是百度最核心的技术团队之一,其成员全部由顶尖学者和工程师组成,已有六十余人,而且这个数字还在不断增长。同时,这支团队在国内外的影响力也与日俱增。赵世奇回忆道:“去年,在计算机语言国际会议Coling召开期间,百度在现场布置的展台周围每天都人头攒动,人们既对百度感兴趣,更对百度的自然语言处理研究感兴趣。这让我突然认识到,百度已经迈出脚步,走向了世界。”
在百度,赵世奇获得了世界自然语言处理领域领军人物之一、百度高级科学家王海峰的精心指导。而赵世奇的博士后研究导师、百度公司CEO李彦宏更是他一直以来的偶像:“这不仅因为李彦宏创立百度取得了巨大的商业成功,更因为他在搜索技术上的成就以及他骨子里对技术的热爱与执着、对目标的坚定与坚守。”
现在,对搜索引擎的未来会变成什么样子,赵世奇心中已有了更加明确的方向,他比喻说:“当电灯发明之前,大家觉得点蜡烛也蛮好的,晚上可以照亮。但是当电灯发明后,人们才发现原来蜡烛是满足不了人的需求的。因此,如果我们依据当前对搜索引擎的定义来看百度的搜索,其实它已经差不多达到了我们的需求,但这不代表用户没有更高的需求。如果我们能够努力地突破这一层,更上一层回头看搜索引擎,才能看到它的不足之处。”
探索搜索前沿技术
“下一代搜索引擎究竟应该是什么样子的?”自搜索引擎诞生之日起,业界对这个问题的探讨从未停歇,而随着互联网信息不断丰富,这个话题也越来越受到关注。
尽管“让机器读懂人的思想”是多年来业界和学术界一直努力的方向,但是实现起来却并非易事。“举例来说,”赵世奇告诉记者,“最近很多人在百度上搜索‘给力的歌曲’,希望能得到相应的答案。如果是我问你,你可能会推荐一首最近听过的好歌。但是,怎样能让计算机理解什么叫‘给力’,并且识别出什么樣的歌曲是‘给力的歌曲’,这个问题就很值得探索。”实现人与搜索引擎之间更有效的沟通,已经成为百度“自然语言处理(NLP)部”最核心的工作任务。简而言之,就是深入理解用户的需求和互联网上的信息,并将两者精准匹配。
作为百度自然语言处理部的主要成员之一,赵世奇对他所从事的前沿探索——语义搜索——有着自己的见解。他认为“所谓语义搜索,是指基于语义分析和用户行为分析等技术,对各类资源和服务进行智能调度,从而更好地满足用户需求的搜索。”具体地,语义搜索的定义应体现在两个层面:首先,在功能层面,语义搜索体现为对用户查询和互联网数据的“深入理解”;其次,在技术层面,语义搜索体现为对多种搜索技术和自然语言处理技术的综合应用。早在2009年,百度CEO李彦宏就创造性地提出了“框计算”理念。框计算是一种简单可依赖的互联网需求交互模式,用户只要在框中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的应用或内容资源提供商处理,最终返回给用户相匹配的结果。
根据赵世奇的理解,“语义搜索”是框计算理念得以实现的重要技术保证,而“语义搜索”未来的重点可能包括“查询的深入理解”和“资源的精细加工”。
如果只是一个技术研发者,赵世奇可能会期待“语义搜索”技术对搜索引擎带来颠覆性的影响,但作为服务4.5亿网民的全球最大中文搜索引擎公司的一员,他早已经学会更多地从用户体验角度来思考这个问题。“在百度的工作让我明白,再炫的技术,最终是为提升用户体验服务的”,所以赵世奇现在常提醒自己,要在理论研究和应用实践间找到恰当的平衡点。
超出预期的成长
赵世奇所在的自然语言处理团队,就是百度最核心的技术团队之一,其成员全部由顶尖学者和工程师组成,已有六十余人,而且这个数字还在不断增长。同时,这支团队在国内外的影响力也与日俱增。赵世奇回忆道:“去年,在计算机语言国际会议Coling召开期间,百度在现场布置的展台周围每天都人头攒动,人们既对百度感兴趣,更对百度的自然语言处理研究感兴趣。这让我突然认识到,百度已经迈出脚步,走向了世界。”
在百度,赵世奇获得了世界自然语言处理领域领军人物之一、百度高级科学家王海峰的精心指导。而赵世奇的博士后研究导师、百度公司CEO李彦宏更是他一直以来的偶像:“这不仅因为李彦宏创立百度取得了巨大的商业成功,更因为他在搜索技术上的成就以及他骨子里对技术的热爱与执着、对目标的坚定与坚守。”
现在,对搜索引擎的未来会变成什么样子,赵世奇心中已有了更加明确的方向,他比喻说:“当电灯发明之前,大家觉得点蜡烛也蛮好的,晚上可以照亮。但是当电灯发明后,人们才发现原来蜡烛是满足不了人的需求的。因此,如果我们依据当前对搜索引擎的定义来看百度的搜索,其实它已经差不多达到了我们的需求,但这不代表用户没有更高的需求。如果我们能够努力地突破这一层,更上一层回头看搜索引擎,才能看到它的不足之处。”