从伟大的算法中学来的经验-搜索引擎索引
该笔记基于《改变未来的9大算法》一书。
搜索引擎索引
相关推荐
- python数据处理 1 删除dataframe中有NAN的 2 pandas中对列进行上下平移(shift) 3. 批量读取文件夹中所有文件 4. python tile函数 5.python中**运算符 6 min(0),max(0)的用法 7 分组求平均值(groupby) 8 数据分组和聚合运算 9 统计每个标签出现的次数 10 生成pandas数据 11 fit()函数不能接收string类型数据 12 将两个含有字符串的集合取并集 13 reduce()函数会对参数序列中元素进行累积 14 拉普拉斯平滑和下溢出 15 从txt文件中读取字符串,并将字符串转换为字符列表 16 文本向量化 17 从50个邮件中随机选出40个作为训练集,10个作为测试集 18 sorted排序 19 压缩与解压缩 20 if not 21 Numpy的矩阵索引和array数组索引 22 getA()函数的作用 23 梯度上升算法原理解析 24 Numpy中np.append() 25 np.c_[xx.r
- 读书笔记——数学之美 1 文字和语言 vs 数字和信息 2 自然语言处理 - 从规则到统计 3 统计语言模型 4 分词 5 隐含马尔科夫模型 6 信息的度量和作用 7 贾里克尼和现代语言处理 8 布尔代数和搜搜引擎 9 图论和网络爬虫 10 PageRange-google网页排名 11 网页查询的相关性 12 有限状态机-地图和本地搜索 13 阿米特 辛格 博士 14 余弦定理和新闻分类 15 矩阵运算和文本处理 16 信息指纹 17 密码学 18 搜索引擎反作弊和搜索结果的权威性 19 数学模型的重要 20 最大熵模型 21 拼音输入法的数学原理 22 自然语言处理教父马库斯 23 布隆过滤器 24 马尔科夫链扩展——贝叶斯网络 25 条件随机场 26 维特比和维特比算法 27 期望最大化算法 28 逻辑回归和广告搜索 29 google云计算的基础 30 google大脑和人工神经网络 31 数据的重要性
- 搜索引擎中的倒排索引是什么 前言 一、倒排索引的原理 二、倒排索引的应用 三、倒排索引和大数据“三驾马车”的故事 四、倒排索引和排序算法PageRank
- Trie|如何用字典树实现搜索引擎的关键词提示功能 Trie字典树 Trie字典树的实现 Trie字典树的时间复杂度 与 缺点 Trie字典树的实际应用 Trie在面试与算法竞赛中的例题
- 大数据学习文章 ZooKeeper: Hadoop集群作业调度算法 初步掌握Yarn的架构及原理 从Container内存监控限制到CPU使用率限制方案 mapreduce编程(一)-二次排序 MapReduce 图解流程超详细解答(1)-【map阶段】 MapReduce 图解流程超详细解答(2)-【map阶段】 Hive SQL的编译过程 Hive之分区(Partitions)和桶(Buckets) Hive性能优化 hbase 学习(十六)系统架构图 HBase -ROOT-和.META.表结构(region定位原理) Hbase 学习(九) 华为二级索引(原理) HBase高性能复杂条件查询引擎 【HBase】zookeeper在HBase中的应用 HBase什么时候作minor major compact HBase的compact分析 hbase分页应用场景及分页思路与代码实现 hbase权威指南阅读随手笔记二之过滤器 *HBase原理、设计与优化实践 HBase性能优化方法总结 H
- 从伟大的算法中学来的经验-搜索引擎索引
- Trie|如何用字典树实现搜索引擎的关键词提示功能 Trie|如何用字典树实现搜索引擎的关键词提示功能 Trie字典树 Trie字典树的实现 Trie字典树的时间复杂度 与 缺点 Trie字典树的实际应用 Trie在面试与算法竞赛中的例题
- 从新手到架构师,一篇就够:从100到1000万高并发的架构演进之路 1、引言 2、关于作者 3、相关文章 4、基本概念 5、纯真年代:单机架构 6、第一次演进:Tomcat与数据库分开部署 7、第二次演进:引入本地缓存和分布式缓存 8、第三次演进:引入反向代理实现负载均衡 9、第四次演进:数据库读写分离 10、第五次演进:数据库按业务分库 11、第六次演进:把大表拆分为小表 12、第七次演进:使用LVS或F5来使多个Nginx负载均衡 13、第八次演进:通过DNS轮询实现机房间的负载均衡 14、第九次演进:引入NoSQL数据库和搜索引擎等技术 15、第十次演进:大应用拆分为小应用 16、第十一次演进:复用的功能抽离成微服务 17、第十二次演进:引入企业服务总线ESB屏蔽服务接口的访问差异 18、第十三次演进:引入容器化技术实现运行环境隔离与动态服务管理 19、第十四次演进:以云平台承载系统 20、架构设计经验小结 附录:更多架构设计方面的文章
- 列出hibernate中实体对象的三种状态?
- Spring IOC的三种主要注入方式?