麦肯锡思维与工作法读书笔记。
读书笔记(一):精益数据分析
精益数据分析读书笔记。
推荐算法学习(十五):Learning to Rank
待完成
推荐算法学习(十五):Learning to Rank
待完成
推荐算法学习(十六):Airbnb个性化推荐
待完成
推荐算法学习(十五):Learning to Rank
待完成
从UML建模到搭建系统原型
本文简单介绍在开发系统前如何进行UML建模和搭建系统原型。
LeetCode刷题总结
本文主要总结了在LeetCode刷题过程中常用到的数据结构、方法技巧以及时间空间复杂度分析,为后续刷题提供思路。内容会根据本人刷题进度不断更新。
推荐算法学习(十四):YouTube推荐系统
YouTube是世界上最大的视频分享网站,其推荐系统需要解决的主要问题有三个。一是大规模数据,Youtube拥有海量的视频资源,其推荐系统必须使用分布式算法以及高效率的在线serving系统;二是时效性,Youtube的语料库每秒钟都会更新许多视频,推荐系统必须能够对新上传的视频以及用户最新的动作做出及时反馈;三是噪声,用户的历史行为特征十分稀疏,模型很难学习到用户真正的喜好,往往会学到更多的噪音。本篇文章将介绍经典的YouTube推荐系统论文《Deep Neural Networks for YouTube Recommendations, 2016》内容,探讨如何构建推荐系统。
推荐算法学习(十三):LSH近似最近邻查找
网站在提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做TopN推荐。在TopN推荐中,我们面对和需要处理的数据往往是海量高维的,怎样快速地从海量高维数据集合中找到与某个数据最相似的一个数据或多个数据成为了一个难点和问题。如果是低维的小数据集,我们通过线性查找就可以容易解决;但如果是对一个海量的高维数据集采用线性查找匹配的话,会非常耗时,因此,需要采用一些类似索引的技术来加快查找过程,通常这类技术称为最近邻查找(Nearest Neighbor,NN),当处理大规模数据时,还可采用近似最近邻查找(Approximate Nearest Neighbor, ANN)。而局部敏感哈希(Locality-Sensitive Hashing,LSH)是ANN中的一类方法。