《数学之好》书评
最近买了吴军的两本书,《浪潮之巅》和《数学之美》,数学之美放在公司,在工作之余欣赏;浪潮之巅放在家里床头,晚上挑灯闲看。数学之美比较薄,我本来也是学数学的,读的比较快一点。停下来,就想写下书评。
本书作者吴军博士,曾任腾讯公司主管搜索、在线广告和云计算基础架构的副总裁。他的经历有兴趣的人可以查一下,下面直接评内容。
基于本书的内容,我觉得读者如果需要明白大部分内容,需要有高等数学的基础,大部分需要概率论和数理统计,小部分需要有离散数学(图论部分);当然,如果读者是个有心人,就算不懂,读完也会找资料研究一下相关内容,从而大有收获。因为书上提到的大部分知识不算太深,属于普及性的内容。
此书从人类历史长河中文字和语言的产生和发展切入,讲述了计数系统的产生,罗马数字,阿拉伯数字及中国数字的起源;再抽出文字和语言背后的数学的主题,顺而过渡到自然语言的处理——进入到人工智能处理文字语言的话题。这个过程历史跨度大而不觉得突兀,处理得很好。 接下来,针对科学家们对语言的分析方向——基于语言规则和基于数据统计的处理,作了陈述和对比;述说了基于语言规则的处理方法的发展和局限,以及新兴的基于数据统计所作的处理的合理性以及可行性,并且以当今最有效的语言处理引擎google(作者曾任职的公司)作例证,表明了当今语言处理的大方向。在这个论断的基础上,引出统计语言模型,并往下稍深入的层次展开,讲述了马尔可夫模型在现代通信领域的应用。而信息熵这部分内容我看的糊里糊涂,都怪当初没好好学习啊,泪奔。。。
作者接着用类似讲故事的模式,介绍贾里尼克教授的生涯故事,对现代语言处理的贡献,讲他如何求学,遇到名师,治学严谨,生活节俭,而后以身作则对新一代的培养,桃李满天下,最后工作直至生命终止安息于工作的桌子上。这些故事很有引导作用,我觉得应该多点出现于大学课本上,不仅学生看,那些教授老师也应该常常看看人家是怎么为人师表的。这些是人性的教育,学术的教育;而那些马列恩斯毛邓三科,应该滚出大学校园,任汝芬这样的教授应该穷困燎倒。吴博士也讲了他对教育的理解,其中我觉得比较深刻的是:
我们都同意这样几个观点。首先,小学生和中学生其实没有必要花那么多时间读书,而他们的社会经验生活能力以及在那时树立起来的志向将帮助他们的一生。第二,中学阶段花很多时间比同伴多读的课程,在大学以后用非常短的时间就可以读完,因为在大学阶段,人的理解力要强得多。
而后面,他把中国的教育批评了一下。我想这些内容也是见仁见智的,我同意小学不用学太多东西,有些东西站的立场不一样,人天生的智力是有区别的(我不同意小学时期老师说的天生都是一样的智力的观点),有人智力超群的人可以一年不学习,到最后几天看看书,就考到80,90分,很多却不行;但是中学时如果没有培养良好的思考方式,或者说天生智力就没到达较高水平,到了大学也不会是一下子就可以学很多东西的。
图论和网络爬虫部分作者讲的很少,但举了一些日常生活中的例子。当然,图论也不是几页纸就能讲清楚的内容,可能是本书主要讲他的主方向,数学在语言和搜索中的应用,作者对图论也是仅仅是点到为止,我倒期待再深入一点讲讲其应用。
接下来就是大篇幅讲述作者的研究主方向——搜索引擎技术。这些东西我以前很少去了解,看完这些内容,再次后悔——当初在数学系的时候没有好好学习啊!向量,矩阵,分解,相关条件,状态机,动态规划,余弦定理,随机分布,期望值,收敛,数学回归模型。。。
书评无法一一列出,我点评水平也有限,大家最好的方法还是去买原著看吧。
如果,如果我现在还是在大一,那么,我将会把打dota的时间分三分之二在学习数学基础知识,把三分一的时间放在数学应用实现的编程实现,把打篮球的一半时间阅读一些像《数学之美》一样可以引导我们向知识王国走近的书籍。而我,也无法摆脱我需要学习马恩列斯毛邓三科那些垃圾理论,我将会用平常的心态应付这些垃圾。
如果,如果你在校园,读一读这本《数学之美》,如果想在IT方面发展,请再看一看《浪潮之巅》,都是值得一读的书。别抱怨在数学课上学的东西一辈子都用不着,数学分析,高等代数,离散数学,微积分,概率论,数理统计,复变函数(泛函分析,实变函数,这两门课原谅我在课上实在没学懂,智力有高下,我的智力就这水平了^_^)。而如果有一些数学应用课:密码学,图形学,数据结构与算法就和生活更加密切相关了。另外,哲学与数学有很强的相关性,里面很多智慧的结晶,强烈建议大家去读西方的哲学,才能摆脱当前政治教育给我们的大学生带来的阴影,给我们一个正确的价值观。
而现在要面对生活,也许已经忘记了当初的梦想,放弃了当初的诺言,但读到此书,让我在忙里偷闲的时候,有兴趣再想一下怎么解线性规划的问题,正交分解怎么做。。。仅此而已。感谢这本书带我回忆了一趟大学的课程,回忆了一趟当时大学的梦想。
附录:这些是吴军发表在google的数学之美系列文章,编辑成书时已经大部分重写,对普通读者更有可读性。
- 数学之美 一 统计语言模型
- 数学之美 二 谈谈中文分词
- 数学之美 三 隐含马尔科夫模型在语言处理中的应用
- 数学之美 四 怎样度量信息?
- 数学之美 五 简单之美:布尔代数和搜索引擎的索引
- 数学之美 六 图论和网络爬虫(Web Crawlers)
- 数学之美 七 信息论在信息处理中的应用
- 数学之美 八 贾里尼克的故事和现代语言处理
- 数学之美 九 如何确定网页和查询的相关性
- 数学之美 十 有限状态和地址识别
- 数学之美 十一 Google阿卡 47的制造者阿米特.辛格博士
- 数学之美 十二 余弦定理和新闻的分类
- 数学之美 十三 信息指纹及其应用
- 数学之美 十四 谈谈数学模型的重要性
- 数学之美 十五 繁与简 自然语言处理的几位精英
- 数学之美 十六 不要把所有的鸡蛋放在一个篮子里 最大熵模型(上下)
- 数学之美 十七 闪光的不一定是金子 谈谈搜索引擎问题(Search Engine Anti-SPAM)
- 数学之美 十八 矩阵运算和文本处理中的分类问题
- 数学之美 十九 马尔科夫链的扩展 贝叶斯网络(Bayesian Networks)
- 数学之美 二十 自然语言处理的教父 马库斯
- 数学之美 二十一 布隆过滤器(Bloom Fileter)
- 数学之美 二十二 由电视剧《暗算》所想到的-谈谈密码学的数学原理
- 数学之美 二十三 输入一个汉字需要敲多少个键-谈谈香农第一定律
- 数学之美 二十四 从全球导航到输入法--谈谈动态规划
- 2楼lihongbiancheng3天前 19:49
- 吴军现在不在腾讯了,又回谷歌了。
- 1楼zfive53天前 17:23
- 《浪潮之巅》 这本是其实让我知道风险投资的运作方式,其他就有什么了,数学之美现在还没有仔细的看