重新认识数据驱动

这两周干的最有意思的一件事,莫过于搞清楚数据录入时效性这个衡量指标了。先讲讲故事吧:

故事起源于数据录入时效性的一个分析,可以看下面的图。以前我们认为通过所谓每天完成百分数这个数据可以实现对时效性的有效评估。说白了就是,当时的一个假设是,如果1天的当天数据完成100%,那么就意味着数据可以在一天内完成,处理时效是24小时。

但是,真实的用于工业生产,你会发现,其实每天的数据不可能达到理想的100%,而是会有各种差异,比如图里面的70%,98%等等。于是乎问题就来了,看了这个数据,我知道我们并没有完成我给用户承诺的48小时返回的指标完成情况这件事情,但是我距离这个目标差距有多远呢?于是乎我们使用了下面一个图的数据指标。

看了17%,50%,作为24小时和48小时的处理时效。刚开始的时候这个数字吓到我了,于是想各种办法改进,当然效果是有的,但是改来改去还是回到问题的原点,我到底和我当初的预期差距有多远?就着现有的数据,我只能模糊的感觉到很远,但是我要如何解释用户那一端获得的真实感受呢?每天一大堆同事抱怨数据录入时效太慢,到底这个感受是否真实呢?真实到什么程度呢?

就着这个问题,我和公司的数据分析老大做了半个下午的深入探讨。得到了如下的一番答案。首先,我得到的答案是,要解决什么问题,就要重新回到问题的原始场景,那就是我所有的问题,其实是来源于我关心用户的真实使用感受。那么我关心的所谓时效性,是返回到用户那里的时间感受,而不是作业机器和车间里的完成百分率。按照这个理论,我们重新画了一下正常作业的数据处理方法,大体是满足泊松分布的。

根据这个分布,大部分的数据会在前面的相对比较短的时间内快速完成,后面的数据将呈现比较明显的长尾效应。于是根据这个图,如果真的想得用户的感知,其实需要的不是计算某个时段处理的比例数,而是应该反过来,看某个固定比例数所处的时间段是多少。比如某个月最后算出来是80个小时,那么就意味着我实际返回给用户的感知是在80个小时以内。这样就很明确的界定了用户对于数据录入返回时间的感受。也解释了为什么用户反馈增加的原因。于是我们后来做了一些从后端到前端的改进方案。

那么好了,说到这里大家可能觉得这个故事的结尾的确实现了数据驱动,但故事的主体,那个翻来覆去,改了三遍的指标到底意味着什么呢?这就是这两周,我特别兴奋于学会的东西,即数据背后的那个建模过程。这才是所谓数据的Insight能够产生的核心原因,也是数据驱动的基础。

往往过去我们对数据驱动可能是这样认识的:

  1. 我们要看数据,数据是重要的交流沟通工具,是一个可以形成共识的语言
  2. 我们要了解各种数据,以帮组我们检验所做工作的好坏
  3. 数据可以为决策提供有效的参考工具

这在我现在看来依然是非常重要的底层基础。但是随着真实使用的场景,我渐渐发现,仅有这些是不够的。随着信息爆炸,我们每个人身边的数据都可以说是海量大,可以说各种各样的数据充斥在我们耳边。尤其是大数据的兴起,更让一群人对这方面趋之若鹜,争相希望把更多的数据展示出来。然而,随着实际工作中的经验我发现,仅仅展现数据是远远不够的。公司的统计系统里面,有超过几十个报表,成百的数据项目在平台上进行统计,可是每当我问道业务部门你们为什么不看数据时候,得到的答案往往是,我无法从数据里看出问题。

这个事情曾经让我百思不得其解,直到我做完上面的故事,我才豁然开朗。原来数据驱动不是简简单单拿着数据去指导下一步的事情,而是数据是为了解决问题而产生的,它的源头应该是解决问题驱动。这就对了,因为事实上,这也是一个公司,一个团队存在的意义,就是为了解决一个又一个的问题。那么这些问题,需要经过合理的,有效的抽象,最终形成一套完整的数据指标。数据的诞生是为了提供证据,而正确的寻找证据,就能破案,能解决问题。但是如果只是数据的罗列,或者不去追踪数据的合理性,和是否能够为问题服务的特性,数据驱动其实是无法发挥价值的。

所以,在数据驱动里,除了收集数据,展示数据之外,还有重要的一个部分叫做数据建模,正是通过这个部分的工作,我们把原始的问题进行剖析,寻找对问题相应的证据,这就是数据驱动的真正意义,也是解决问题的根本。

OKR学习总结

OKR已经尝试了3个季度了,感觉从一团迷雾里渐渐看出了点眉目,我很难说现在的一切是对的,但是总结出一些东西,为了今后更加努力的改进。既然OKR是目标,既然OKR是数据驱动的基础,那么就要坚持演进下去。以下想表达的,更多是基于自我OKR回顾的一种总结,并不是OKR完成的组成。只是像以此描述我在定义OKR的过程中所走过的那些坑坑洼洼。

OKR疑问有所斩获:

  • Align目标
    这个话题其实以前是知道的,但是体会不深。直到上一次我遇到了一个世纪的问题。当时所有“基础架构”团队的OKR基本上都是1on1来制定的,基本上纯从每个人的想法出发,我这边进行了一些修改和补充。然后,后来做到一半,技术团队OKR出来了,发现之前定义的好多和技术团队OKR关系不大。包括后来又改过几次,才发现慢慢上到。所以OKR以上上下下做做右右信息透明为第一要务,为的就是让大家目标能够algin到一起去。
    具体改进方法:OKR一定要从公司级别开始定义,以此来推导出与公司目标align的技术团队OKR,这个OKR,理论上还应该回过头来和其他业务团队的OKR(针对杏树林而言,可能更多是业务团队)进行align。不过在实际目前的操作中可能并不需要从一开始就这么做,毕竟所有团队也都是为了公司的OKR完成的。因此,出于效率考虑可以继续下去。那么接下来就是小组或者个人级别的工作了。最终,通过一系列的OKR制定工作,可以保证每个季度大家都在一个方向上工作,帮助公司完成商业目标。

  • 团队/个人对OKR负责
    说到OKR,就不得不说到很多技术团队的同学们反应,在公司缺乏团队感,不知道向谁汇报,谁该有权利给谁分配任务。其实OKR就是很好的一个衔接点。每一个人为自己的OKR负责,OKR的来源可能是多方面的。在初期一定会有个人帮助他订立OKR,收集需求和反馈。对于业务团队内部来说,往往这件事情比较简单,就是业务团队的技术Lead和业务本身。对于基础架构或者跨团队支持的技术同事,往往这个时候技术同事的级别本身都比较高,那就需要对技术总监团队负责。总体而言,谁帮助订立OKR,就应该谁是负责人。但是OKR一旦被制定下来,每个人应该为OKR负责。

  • OKR为了制度改变
    OKR不是绩效目标。因为假设人是优秀和自驱动的,不满足这个条件的人,可以不存在于OKR体系,而实用类似KPI等其他体系。这个话题缘起于对OKR Review的一次讨论,集体内容不说。反思大概是这样。如果OKR的订立前提是,组织内每一个人都是积极的,主动的,乐于思考和勇于承担的,那么OKR的作用是为了帮助大家,对没有做到或没有做好的问题,寻求解决方案。而这种解决方案在实践中,往往就是公司的一些制度和方法的演进。也就是说,任何事情一定要寻找一种新的积极的流程去解决掉。这个前提就是去寻找当时订立OKR之后,发现执行过程中没想到的东西。然后寻找方法,避免掉没想到问题的再次发生。这样可以将OKR订立的更好。

时间计划值得坚持:

  • 定理时间的经验
    根据Q1的经验,我们在给Q2定力OKR的时候做了一些改动

    • 为了更高效的完成OKR,我们采用组级别进行OKR定义,分为基础架构,公共服务组,PTL团队。
    • 将技术总监团队先完成OKR的制定,然后是基础架构团队,然后是PTL团队。
    • 先进行上季度OKR Review,然后进行新季度OKR制定
    • 继续讲人员限定在基础架构组+PTL范围内,力图通过Q2完成人员培训工作
  • 双周回顾的经验
    技术团队目前还无法形成单周回顾,效率过于频繁可能导致精力分散,而且实践执行中发现难以完成。主要还是大家没有养成这类工作的习惯。所以目前还是我一个人在推广,测算下来,基础架构组+公共+PTL的总人数目前有12个人,接下来Q2可能会有15个人,数量庞大,而且没有一个标准,所以尚无法完成扩展。但是下面的表格值得推广,确实效果很好。

回顾方法有待改善:

  • Q1本季度感觉回顾方法有待改善。学习了一下文亮的OKR Checklist,打算应用到接下来的制定和回顾工作中。接下来会专门做一个表来进行工作。

_OKR检查表_

  1. Key Result 是否能够实现Objective,套用句型:通过实现XXX(某一条具体的KR),就能促进XXX(某一条具体的O)的实现。
  2. Objective 和 Key Result 描述的是达到什么,而非做了什么
  3. 检查是否满足基本明确定义和可度量的要求
  4. 检查是否完整反映了个人的主要工作
  5. 提醒合作方、同事来给出反馈
  6. 检查是否和团队的目标一致
  7. 检查是否和个人能力一致 (过易和过难都不好)
  8. 检查是否足够专注、优先级是否清楚

还没有完成的话题:

  • OKR如何打分,如何数据结果导向

团队Lead需要关注的四件事

这个周发生了几件小事情。

  • 首先和杨宇、张诚有过一次讨论,觉得事情推进困难,一个随访的小红点问题似乎N久也得不到解决。关于operation和admin等后台不知道谁管也不知道该怎么办。
  • 在本周由于同事离职反馈了两点信息,公司创业气氛不够,总觉得推动不足,以及责任心的一场讨论。而团队的同事另一方面觉得,自己没人管,没有人安排工作和关心。
  • 第三个事情是周末一早出现的一个产品事故,业务负责人很难受;另一方面其实我能感觉到,事情相关的技术同事也都是公司数一数二有责任心的人,怎么会出现这个结果呢?

以上的事实,可能很多人都会归结成一句挺伤人心的话,叫做“责任感意识不强”。于是,这个似乎就理所应当成为了一个“人”的问题,更进一步说成了“别人”的问题。但说实话,在我心里,我挺认同文亮常说的那句话,“一个事情成功了找客观原因,失败了一定要找自己的问题”。这和我的为人风格也很像,说白了,任何事情,无论成败,都应该称为自己前进的阶梯,只有这样我们才能从中成长,不断颠覆打败那个曾经的自己。

于是周末和同事的一场讨论,一场回顾会,让我好像悟出来点什么。话题开始与《格鲁夫给经理人的第一课》。这是一本像“德鲁克”系列的经典管理书。(虽然会不屑于一些陈旧的言论,但是经典总归是经典里面的宝藏,在不断的实践中会一点点露出来)

书中有提到的一个观点。作者收集了自己工作中的时间和工作内容,概括起来大概分为四类,在这些事件中,时间的分配变少是最合理的。

在我们的讨论中,我发现,其实各个公司做得越好,越必须遵循这个原则。如果以这个原则我得到了一些新的想法:

  • 从我们几个所谓技术管理的四个人的思想里,我们坚持认为,管理的目的是为了更好的帮助大家工作成长和提高,而不是为了“分配任务”,这一点我坚持认为是正确的,而且会一直坚持下去。所以,团队的人觉得没人管这个事情是错误的,而是让团队理解,他们不是要被管理,而是自我管理,做和公司方向一致的,并且自己认为争取的事情。有问题向周边人询问,这才是“杏树林”的文化。
  • 既然是这样,我们是一批支持格鲁夫模型的人,那么问题出在哪儿了?在我看来,我们希望尽量少的做决策,多一点给大家建议,和引导大家的事情,而管理团队目前最缺乏的,反而是上面两个,那就是“传递”和“收集”
  • 关于“收集”目前还没到这个高度,所以尚待完善,但是关于“传递”这个事情我们却真实应该做许多。其实我们总希望大家主动来问我们问题,但是如果我们没有传递足够强的信号给他们,如果我们传递信息不够多,大家在做事情的时候,就很难实现问问题这件事情,因为有太多他们所不了解的东西。所以你就可以理解,为什么ThoughtWorks,这么在乎每个月的monthly update,在乎buddy/sponser的1on1吃饭,在乎早上的站会,在乎物理墙,包括在乎老大不能有自己的座位,需要到处做,在乎小组一张大桌子进行随时随地的交流。这些都是信息充分传递的表现,只有信息传递了,大家才能拥有互动。(同理,关于OKR,我们也得出了类似的结论,那就是,每一次OKR指定的过程,恰恰是公司自定向下传递信息的过程)因此,信息的快速、健康、准确的传递,是企业管理者面临的重要责任。
  • 于是乎我想到了关于7-10人管理边界的问题,《How Google Works》里面提到,Google认为管理边界应该不低于7个人,而不是像传统企业不超过7-10个人的上限。我以前的理解是,这是为了扁平组织的需要。但随着理解的深入,这原来是一个非常高的管理要求,说白了,传递效率是人类社会最大的障碍(推荐看三体,或者星际争霸,来了解哲学意交流的方法)。也正是因为此,人类单人传播能力大体在7-10个人之间。如果要实现更佳广泛的传播,就要借助各种“OKR”,“看板”,“monthly update”等等现代管理方法,从而最终实现管理扁平化。

综上总结,管理扁平化,不是一个简单的规定或者想法。身为团队的Lead们,大家肩负着“收集”和“传递”信息的使命。在这方面,我们不应该把责任简单的归结到人不行,不能充分的提问,甚至没有责任心。自己的工作没有做好,才是这些事情的核心。

因此,我自己打算给自己设定一个目标,要在未来的半年里,第一,变成一个大喇叭,不断传播公司各个级别的信息,学习更多的方法,让信息传播更有效率。第二,让周边的管理者们,尤其是技术总监们,管理团队们,更佳立即信息传递的重要性,让公司文化真正得到落实。我理解这也是所谓工程师文化必不可少的组成部分。

指数型组织EXO读后感

摘要:

  • 指数型组织是一系列信仰MTP和为之奋斗人组成的集合
  • 指数型组织是以一套可复制的“内核”为基础而存在的
  • 指数型组织一定是“不完整的”,甚至不一定是一个公司,可能只是一个部门

今天来一起聊一本书。EXO(Exponential Organizations)指数型组织。书已经送人啦,所以完全靠着记忆来写。记录下我所理解这本书的精华部分。

这本书最让我惊讶的部分是他描述了一个新时代下的公司需求模型和与之相配套对应的组织模型。书中认为,过去我们在理解商业需求,往往是基于稀缺化的理解。认为企业的目的就是占有稀缺资源,并以低廉的成本来销售稀缺资源从而获得收益。简言之,企业的目的就是“出售稀缺性”。

  • 首先必须承认这是对的,毕竟在过去的生产工具情况下,任何一个单体的个人都很难靠自己去触及到所有生活必需的来源。那么能触达人越少,资源也就越稀缺。几个例子,就是钻石,其实钻石这个东西本身在自然界并不稀缺,甚至人类都能加工出钻石。而依照“出售稀缺性”的理论,事实上几家国际钻石企业垄断了全球所有的钻石矿藏,并不断通过政府关系,广告媒体,对外宣传纯自然钻石的难度和少有,造成了一种“人为稀缺性”的假象。所以现在的钻石才卖的如此之价格高昂。

  • 其次必须承认这是错的,因为在现代互联网发展到今天,个体世界已经在出现变化。在这方面首当其冲的就是信息稀缺性在被日益打破,信息爆炸,如今在Google上已经可以找到几乎所有碰到问题的答案。在信息富足的基础上,所谓互联网+,O2O在做的,就是通过信息的富足尝试激活更广泛意义上的富足资源。比如Uber,其方法是通过信息的快速传播,将满大街跑和停在停车场的汽车的剩余座位开放出来,让更多人使用。据说全世界每时每刻,有除去驾驶员之外的93%的汽车乘坐位是空的。

因此,现代社会随着互联网的发展,企业从“出售稀缺性”开始进入到“出售富足性”。用两句话解释我的理解:

  • 出售稀缺性:这个世界上只有我这里有,你来买吧
  • 出售富足性:我告诉你这个世界还有哪里有,你去买吧

也正是因为这种变化,于是有了新时代企业所谓互联网公司“独角兽”类型公司的发展方法。我不买产品,我买“算法”,这里的算法是一个广泛意义上的含义,可以是一种“流程”,可以是一种“自动化方法”,可以是一种真正的“算法”,也可以是一种“产品”。所以问题就来了,既然我是一个“告诉你哪里有”的内核,那我必然是要靠可大规模复制的“量”来取胜的,这和薄利多销有点像。不一样的是,新时代企业要做的是把销售的边际成本降到最低,甚至0的地步,来取胜。这就是EXO这本书告诉我们的一个新的商业逻辑。也是互联网的主要逻辑。

说到我们的数据采集部分,对于数据采集,这是个很慢的工作传统的方法是尽量多的占有低端录入人员,销售大量的“稀缺”人员时间。但是,随着众测,机器自动化的发展,新型数据采集工作,销售的是广泛人的“富余时间”,同时通过算法,找到拥有“富余时间”的人,和降低这种购买“富余时间”所使用的成本。

讲完商业思路的主旨,下面就是这本书让我非常欣赏的部分,就是将如果要实现“富足”销售,企业需要具备的几个基本要素。书中简化为了两个词,SCALE和IDEAS,这也是这本书非常值得推荐的原因。

简单讲几个,其他的大家可以看书。书中认为,SCALE是外部属性。

  • 其中C,是Community&Crowd,社群和大众。书中认为,既然组织售卖的是富足性,那么这种富足性的来源一定是组织外部,因为组织的增长永远呈现的是线性模型,很难呈现大的指数型增长,这和招聘是相关的。因为优秀的人员是有限的,所以就需要广泛的通过外部合作来创造增长。传统意义上认为,外部合作是不稳定的,而如果读过《失控》的人都知道,一个完全有序的可控制体系是不存在的,有的就是一种混沌的平衡,而一个系统(企业或大自然)一定可以自我完善,最终形成一个稳定形态。对社群和大众的使用,主要就来源于这个思想。认为只有通过最大限度的网络和不多扩张社群资源,最终才可以实现组织利益的快速指数型发展。比如众包就是这样一种模式,通过平台调度算法,和各种企业运营手段,让一个广泛的人群使用这个平台,最终完成数据的采集工作。

  • 关于A,是Algorithm,算法。这个其实挺明白的,举例说Uber之所以能够实现快速扩张,是因为算法本身是不变的,同样的算法是可以大规模扩展的。这里我想说的是自己的一个理解,那就是,算法这个东西可能许多人都会想象的比较抽象。但是如果说广义的“算法”其实就比较好理解了。因为一个写在纸上的流程,第一步、第二步、第三步做什么也可以称之为一种“算法”。这种算法帮助管理和执行变得简单,降低了反复沟通不标准所造成的成本浪费。产品模块,其实也是一种算法,因为从某种程度上,产品模块就是自动化了的“纸面流程”。讲大量人的工作变成了机器,通过自动化的方法进一步降低了成本。当然,狭义算法,比如对比,查询,搜索,推荐,学习,这些都是更进一步的算法部分。还拿数据采集做例子,最早的采集系统是

说了两个外部属性,再来说说内部,在IDEAS部分,

  • 关于D吧,是Dashboard,意思是说对于一个组织而言,既然数据的重要性不言而喻,那么接下来的问题就是如何表现,所以“仪表盘”就显得格外重要。它是数据的基础,也是工作赖以进行的保障。在后来和公司数据老大的了解中,我更加能明白仪表盘本身还要分成几类

当然,书中还描述了许多别的东西,特别是如何执行和实施方面的东西。比如一个企业在关于实验要如何做,如何通过数据预期来规范实验的方向和效果。这里不打算一一陈述。想再多一些内容谈谈自己的感悟吧。

  • 指数型组织是一系列信仰MTP和为之奋斗人组成的集合。他们在一起的原因不再仅仅是为了更好的更高效的进行生产,而是基于一个理想。比如SpaceX的一个让交通变的更容易。杏树林我理解之所以让我信仰,就是那句“让医生更轻松”。因为我总是喜欢加上后半句,如果“医生每天效率提升1%,那么全中国,我们的兄弟姐妹将有上千万人次能够享受到更好的医疗”。这才是杏树林我理解里的伟大。

  • 指数型组织是以一套可复制的“内核”为基础而存在的。通过内核极大限度的降低旧有生产工程的边际成本,来实现高价值。所以新兴公司一定是“小的”,并且以类似“算法”和“产品”为中心而存在。所以,指数型组织一定要问自己一个问题,我的工作边际成本是不是足够低,远远低于同业。我的方法是否是极低成本复制的。如果不是,那么请审视一下自己你的工作。作为数据平台团队,我希望做到这一点,我们的每一个产品都可能量的极大降低已有工作的负荷,提升工作效率,并且如果可以,将它转化为商业产片,也就意味着,让他进行更加广泛意义上的复制。

  • 指数型组织一定是“不完整的”,现代互联网通过连接联系万物,那么公司也一样,他不再是一个必须拥有所有部门而存在的结构体,而是为了一个MTP(书里说这是公司的目标也是)而努力的一群人。那么他的工作不是让整个xxx提升,而是让一个属于自己的MTP得到提升。每个人都无法解决链接那一头,但是可以解决的是,将许多东西进行链接,最终形成指数型成长。

所以机遇这个,也是为什么我想把保险和数据整合。一个是HAVE,一个是READ,两者互相都在做这一点彼此的事情,但是又各有重点。只有互相合作,减少重复建设,才能真正把实现“杏树林数据价值化”这件事情走下去。这就是我想做的。我会相信,如果数据平台当成一个连接体,把公司内部作为一个客户,把公司外部做为其他平等的客户,这样,一个指数型组织才有可能真正成长起来。因为组织的内部所有工作,都将围绕着最大限度降低边际成本这件事情来完成,这样就一定能突出价值的最大化!加油吧!