事务

尽管大多数程序员都认为事务是如此简单和自然,但事实上事务不是一个天然的东西,而是人为创造出来的,目的是为了简化应用层编程。 对应用层来说,底层
Read more →

软件随想录(by Joel Spolsky)

这周在地铁上读完了 Joel Spolsky 的《软件随想录》,译者是阮一峰。摘录或提炼一部分有趣的东西于此。 1991 年,Joel Spolsky 加入微软 Excel 开发小组,担任 Program manage
Read more →

Haystack (facebook是怎么存照片的)

本文写于 21 世纪 10 年代最后一个圣诞节的晚上,内容为 facebook 的论文 《Finding a needle in Haystack: Facebook’s photo storage》的阅读笔记。该论文旨在解决社交网络中海量
Read more →

LSM Tree vs BTree

本文为《数据密集型应用系统设计》第三章第一节的读后感 数据需要持久化,将内存中的状态落到磁盘上,就需要使用存储引擎。最简单的存储引擎就是一个数
Read more →

隐马尔科夫链与维特比算法

马尔科夫链 明天的天气怎么样?明天的股市怎么样?用户下一个输入的单词会是什么?这些问题都是一个随机过程的问题(就是「随机过程随机过」的那个随机
Read more →

P99与蓄水池算法(reservoir sampling)

一个监控问题 假设你是一个运维工作人员,维护着一个访问量巨大的服务,然后有一天,老板跑来问你这个服务的 p99 响应时间是多少?(p99 响应时间:系统
Read more →

CUDA 入门实战 2:将矩阵乘法速度提升 5000 倍

本实验采用不同的方法来计算 8192 * 8192 的整型矩阵乘法运算。 C 语言版 C 语言是大家公认的高性能语言,那我们就从 C 语言开始吧。 // 用一位数组表示二维矩阵 mat1
Read more →

Cuda实战入门

CUDA (compute unified device architecture) 是 NVIDIA 所推出的一种并行计算平台和并行计算 api。 CUDA 在并行计算上可以大显神威,因此,我们先要找到一个可并行的问题。一个很简单的可并行问
Read more →

为什么拒绝掉前37%的追求者是错的

Problem Formulation 假设你一辈子可以遇到 100 个潜在配偶,在遇到每一个潜在配偶的时候,你只能选择接受或者拒绝。如果你选择接受,则意味着你放弃了后面所有潜在的配偶
Read more →

机器学习视角下的软件工程过拟合问题

软件工程中充斥着过拟合,它不但刻画了我们在构建系统时常常掉入的思维陷阱,也刻画了我们日常生活中思考与行动的方方面面。 什么是过拟合 在机器学习中
Read more →

自我觉知的能力与做事的态度

最近对自己的行为模式进行了一些观察,发现自己很容易在遇到硬骨头的时候出现拖延症的现象。比如在进入某一主题的学习时,发现该主题内容非常丰富,且
Read more →

Got a PC

从 15 年初购入人生第一台 mbp 之后,再也没有使用过 PC 了。最近趁着 618 组了一台电脑,平时的主力机器是 mbp,然后家里放了台 mac mini,但是最近为了在家
Read more →

当我们谈论杜兰特,我们其实是在谈自己

人们谈论问题容易陷入对意义的讨论,这种试图对本质的窥探虽然“有用”,却也十分危险。 早上看到杜兰特跟腱受伤的新闻,各大媒体纷纷表示,杜兰特在总
Read more →

语言的雅俗

昨天看到 slack 里面有个网友说:”这是我下午看《洞察》的时候突然冒出来一个问题:钱有许多称呼,比如阿堵物、孔方兄等,可是既然它们指的都
Read more →

什么是概率

假设我们现在要扔一枚硬币,我问你这枚硬币正面朝上的概率是多少?你一定知道是 0.5。但是让我们来仔细想想,概率为 0.5 到底意味着什么呢?一种常见的
Read more →

生活中的弹力系统设计

艺术来源于生活,系统架构也是如此。 基于微服务的分布式系统架构所面临的挑战非常巨大,充满了各种不确定性。为了能够提高SLA,我们需要让系统能够
Read more →

关于麻将能不能进入奥运会的讨论

这篇文章来源于一群软件工程师在晚餐时的讨论,论题是中国麻将能不能进入奥运会。这类问题在不同的群体间相信已经发生过无数次,这次当然也毫无例外的
Read more →

信息化与自动化

信息化与自动化 这些年来,”工业 4.0”,”2025 计划”等新名词越来越多的出现在人们的视野,
Read more →

模型设计的两大准则:NFL与奥卡姆剃刀

NFL(无免费午餐)定理 模型的合理性很大程度上取决于待解决问题本身的特征。 无免费午餐(No Free Lunch, NFL)定理证明了任何模型在所有问题上的性能都
Read more →

身高背后的统计模型

给同年龄的一百个小孩量身高,已经量了 99 个,请问最后一个小孩的身高有 99%的概率会小于多少。 我们只知道这些数据来自同一个总体(服从同一个分布)
Read more →