数据分析具有很强的价值,但是数据分析的价值却因数据分析的服务对象具有较强的差异。而数据分析的服务对象也深刻的影响着我们数据分析的策略。
大体上来说,数据的服务对象主要分为两类∶C端用户与B 端客户。
C端C 端用户指主要指绝大多数关于生活方面的应用,或是可以浏览、访问到的许许多多网页应用。C端用户的用户体量常常是非常大的,例如,2019年3月微信的活跃用户接近10亿,"饿了么"的活跃用户有一千多万,即使是一个非常不知名的电商网站,其月活跃用户也有几十万。因为大多数C 端产品是免费的,C端用户可以很容易地接触到数据服务方提供的服务(如下载一个 App 或是扫描一个二维码)。当然,用户也可以很容易地抛弃一个之前正在使用的数据服务,并用其他数据服务代替。
从数据分析角度来看,C端用户的行为是复杂的、其行为充满很大的不确定性。数据分析师知道C 端用户的行为中有许多的规律,但面对C端用户带来的海量数据,往往又显得有些"头大"和无所适从。因而,当一个数据挖掘工程师,或是数据算法工程师在面对这些数据,服务于C 端用户时,他们的自由度也会相对比较大。数据算法工程师可以使用非常灵活的方法,采用非常多样与复杂的模型,进行数据处理。
虽然说产品经理或是其他业务代表对数据算法工程师怎么处理数据无法给出指导,但这也并不意味着数据算法工程师的产出可以随心所欲。数据分析师往往需要配合产品需求,并满足一定的业务指标。
B端狭义的 B端客户通常指企业客户或商业客户,广义的B端客户除了以上所说的企业客户外,还包括如政府客户(有时政府客户会被单独称为 G端客户,G即Gov 的缩写)和其他组织客户。
相对于C端,B端的数量会比较小,但 B 端客户拥有一些社会或组织影响力,也具有丰富的业务知识。同时B端与C端对于结果的反馈是不同的,C端用户通常是通过用户群体的行动,以数据直接反馈;B端则是通过开会沟通、商务洽谈、商业合同等客户直接反馈的方式。
B端客户的数据业务并非全靠数据说话,客户自身就会提出相关的业务需求及业务方面的知识,对数据分析师来说,当数据量不是很足的时候,这些来自业务方的要求和需求知识,往往可以帮助数据分析师掌握数据的规律,帮助数据分析师开展数据分析工作。当然,这些琐碎的要求和需求也可能束缚住数据分析师的手脚。同时,数据算法工程师从数据中挖掘并总结出了反常的规律,客户会怀疑结果的正确性;而当数据算法工程师的产出符合常识,客户又会怀疑数据分析与挖掘工作的必要性……·诸如此类的原因,使得在与 B 端客户的业务合作中,相互的沟通常常会消耗很大一部分的精力,数据分析与规律挖掘的工作所占比重会相对减少。
B端客户常常会要求数据分析师的产出具有较强的可解释性。很多 B 端客户虽然具有很专业的业务知识,但对手数据科学却缺乏理解。数据算法工程师做出一个模型时,客户常常会要求数据算法工程师给出具备较强的可解释性的原理说明。更有客户,除了较强的可解释性,还要求数据算法工程师产出的模型具备可控性,客户如果觉得哪些指标需要调整,要可以即刻施加控制。因此像神经网络这样的解释性较差的模型在 B 端客户的业务场景下就很少会被应用了,像支持向量机(Support Vector Machine,SVM)这样虽然有较强的可解释性,但让客户了解并认可这种可解释性需要消耗巨大教育成本的模型,生存空间也非常有限。因此,与 B 端客户成功合作的最终模型,一般情况下,其复杂性不会太高,数据工作的难度不是很大,模型可解释性非常强,一些直观的统计指标会出现得非常频繁。
各种各样的可视化产出是B端客户非常容易接受的方案。可视化方案依赖于图表的形式,具备强直观性和弱可解释性的优势,要是加上酷炫的设计,更能契合 B 端客户的需求。很多以数据驱动为业务的公司,很大一部分项目都会包括一块显示大屏,或一个布满各种可视化模块的网页,这也是B端客户相关业务独有特性的反映。
参考资料:《数据分析通识》



