“这是区别于关键词搜索的下一代搜索引擎技术,在不久的将来,它将彻底取代以Google、百度为代表的‘关键词’搜索引擎。”林奇对智能搜索引擎的未来充满信心。林奇的目标是希望自己的公司能成为“无序数据的神殿”林奇表示,搜索引擎的整个故事还远未结束,现在运用的只是可以被实现的技术中很小的一部分,他的传奇才刚刚开始。
“在剑桥大学旁边一家幽静的咖啡馆里,一位有些秃顶的年轻人正在滔滔不绝地讲他自己发明的算法。他对面的听众,正目光游离地看着窗外。”
在这幅画面上,那位秃顶的年轻人就是后来被称为英国的比尔.盖茨的麦克.林奇(MikeLynch),坐在他对面的朋友是英国的一位知名音乐人,虽然朋友几乎都没有听懂林奇的算法到底是什么,但他还是决定向林奇投资3000英镑,作为林奇和他的同伴开公司的第一笔资金。正是用这3000英镑林奇成立了他的第一家公司,并开始了自己的创业之旅。
“他根本听不懂我在说什么,我猜他是被我们的热情打动了。”回忆当时那位音乐人为什么给自己投资时,林奇依然这样认为。
叛逆的消防员之子
林奇的父亲是一位消防员,老林奇给儿子的建议是不要找一份像他那样的工作:当所有人从大火中向外跑时,你却不得不冲进去。“这时候,你明明知道自己正在接近死神,但还是得这样做。”老林奇告诫他的儿子:这种痛苦的滋味是任何没有经历过的人永远无法体会到的。
而长大后的林奇确实像他父亲希望的那样,没有成为一位“当别人往外跑时却不得不向里冲”的消防队员,因为他考上了剑桥大学,并留校成为了一位受人尊敬的讲师。
本来,林奇的父母希望儿子在剑桥好好地工作,成为一位受人尊敬的学者。“作为一个工薪阶层出身的人,在这样一个全世界著名的高等学府里工作,家人也会感觉到很骄傲。”林奇说。
“英国是一个非常传统的国家,等级制度是历史遗留下来的,工薪阶层很难进入上层社会,这一点,英国和中国有很多相似的地方。”林奇完全能够理解父母对他的期望。
但是,林奇的思想在这家世界著名的大学里却发生了变化,他希望通过创业改变人生。
“有一点叛逆是很重要的。”林奇告诉记者。“这可能是一个人取得非凡成功的第一步。”
当时25岁的林奇,正是在英国剑桥大学当讲师时突然意识到自己在数学的某些神秘领域——图形识别算法——内所拥有的专门知识可以在商业中派上用场。他看到,许多迥然不同的人,例如希望处理数字信号的唱片录音师和希望研制识别字迹的软件程序员,所依赖的都是类似的算法。他和另外两位热爱技术的朋友在经过文章开头的那一幕后,创办了专门寻找需要解决难题的“神经活力公司”(Neuro-dynamics)。
另辟蹊径的搜索狂人
就在林奇的公司成立后不久,英国的一所情报机构向他提出了一个难题:它需要一种较好的办法来对它保存的大量资料进行整理、归类和检索。特别难办的是,许多文件使用的是特工人员的代号。比如文件中出现的“手枪”这个代号很容易同现实中的手枪混淆,有谁能对这种文件进行整理和检索呢?
“答案是:可以利用上下文。”林奇和他的小组研究出一种从文件中抽取重要概念的技术。他们不是像大多数检索和归类软件所做的那样把注意力集中在关键词上,而是从词语在文中出现的方式和频率中抽取重要思想。
这种软件利用根据18世纪英格兰长老会牧师托马斯.贝因斯(ThomasBayes)的著作归纳出来的概率论,为每个概念制定一个数学识别标志,然后再在其他文件中寻找类似的概念。
托马斯是18世纪英国的一名行为古怪的传教士,他试图通过数学证明上帝的存在。而林奇另辟蹊径使用贝因斯的理论在文本中进行概念搜索,从而替代关键字搜索。
林奇相信,所有联网的公司都可以从他的检索“无序”数据的技术中获益。所谓“无序”数据,是指不适合进入井然有序的数据库的具有无数万亿字节的报告、电子邮件、发言、新闻稿、网页等等。
“在剑桥大学旁边一家幽静的咖啡馆里,一位有些秃顶的年轻人正在滔滔不绝地讲他自己发明的算法。他对面的听众,正目光游离地看着窗外。”
在这幅画面上,那位秃顶的年轻人就是后来被称为英国的比尔.盖茨的麦克.林奇(MikeLynch),坐在他对面的朋友是英国的一位知名音乐人,虽然朋友几乎都没有听懂林奇的算法到底是什么,但他还是决定向林奇投资3000英镑,作为林奇和他的同伴开公司的第一笔资金。正是用这3000英镑林奇成立了他的第一家公司,并开始了自己的创业之旅。
“他根本听不懂我在说什么,我猜他是被我们的热情打动了。”回忆当时那位音乐人为什么给自己投资时,林奇依然这样认为。
叛逆的消防员之子
林奇的父亲是一位消防员,老林奇给儿子的建议是不要找一份像他那样的工作:当所有人从大火中向外跑时,你却不得不冲进去。“这时候,你明明知道自己正在接近死神,但还是得这样做。”老林奇告诫他的儿子:这种痛苦的滋味是任何没有经历过的人永远无法体会到的。
而长大后的林奇确实像他父亲希望的那样,没有成为一位“当别人往外跑时却不得不向里冲”的消防队员,因为他考上了剑桥大学,并留校成为了一位受人尊敬的讲师。
本来,林奇的父母希望儿子在剑桥好好地工作,成为一位受人尊敬的学者。“作为一个工薪阶层出身的人,在这样一个全世界著名的高等学府里工作,家人也会感觉到很骄傲。”林奇说。
“英国是一个非常传统的国家,等级制度是历史遗留下来的,工薪阶层很难进入上层社会,这一点,英国和中国有很多相似的地方。”林奇完全能够理解父母对他的期望。
但是,林奇的思想在这家世界著名的大学里却发生了变化,他希望通过创业改变人生。
“有一点叛逆是很重要的。”林奇告诉记者。“这可能是一个人取得非凡成功的第一步。”
当时25岁的林奇,正是在英国剑桥大学当讲师时突然意识到自己在数学的某些神秘领域——图形识别算法——内所拥有的专门知识可以在商业中派上用场。他看到,许多迥然不同的人,例如希望处理数字信号的唱片录音师和希望研制识别字迹的软件程序员,所依赖的都是类似的算法。他和另外两位热爱技术的朋友在经过文章开头的那一幕后,创办了专门寻找需要解决难题的“神经活力公司”(Neuro-dynamics)。
另辟蹊径的搜索狂人
就在林奇的公司成立后不久,英国的一所情报机构向他提出了一个难题:它需要一种较好的办法来对它保存的大量资料进行整理、归类和检索。特别难办的是,许多文件使用的是特工人员的代号。比如文件中出现的“手枪”这个代号很容易同现实中的手枪混淆,有谁能对这种文件进行整理和检索呢?
“答案是:可以利用上下文。”林奇和他的小组研究出一种从文件中抽取重要概念的技术。他们不是像大多数检索和归类软件所做的那样把注意力集中在关键词上,而是从词语在文中出现的方式和频率中抽取重要思想。
这种软件利用根据18世纪英格兰长老会牧师托马斯.贝因斯(ThomasBayes)的著作归纳出来的概率论,为每个概念制定一个数学识别标志,然后再在其他文件中寻找类似的概念。
托马斯是18世纪英国的一名行为古怪的传教士,他试图通过数学证明上帝的存在。而林奇另辟蹊径使用贝因斯的理论在文本中进行概念搜索,从而替代关键字搜索。
林奇相信,所有联网的公司都可以从他的检索“无序”数据的技术中获益。所谓“无序”数据,是指不适合进入井然有序的数据库的具有无数万亿字节的报告、电子邮件、发言、新闻稿、网页等等。