2013年,是大数据和移动互联元年,标志着我们已经进入大数据和移动互联时代,在大数据时代,用户对信息的需求更加个性化、精准化,而借助于数据挖掘和分析技术,传播体现出智能化的趋势,而其盈利模式日趋混合化和多元化。
一、大数据时代到来的源动力:信息开放
1、技术赋权:四次传播革命助推信息开放
从远古到现在,我们经历了文字的发明、古登堡印刷术、电报技术的应用和互联网等四次传播革命,每一次传播革命都使得信息的数量快速增加,信息的公开程度快速增加。
首先,文字发明打破了时间的限制,使得代际传播成为可能。在文字发明之前,传播只能通过口口相传,信息量极其有限,讲古人也具有很大的权力。在公元前4000年楔形文字出现之后,文字发明带来的第一次传播革命使得代际之间的传播成为可能,使得信息数量开始大幅度增加。
其次,古登堡印刷术打破了范围限制,使得大范围传播成为可能。在古登堡印刷术出现之前,书籍主要依赖掌握文字的抄书人,一方面,由于抄书人的数量很少,信息积累和传播的范围也受到很大的限制;另一方面,抄书人具有很大的权力,甚至比一些王公贵族的权力都大。1450年,古登堡发明了印刷术,给我们带来了第二次传播革命,此后的50年间,大约有800万本书被印刷,比之前的所有的手抄本还多。这些大量的书籍帮助更大范围的人获取知识和信息,使得更大范围的精英能够更好地获得信息。
第三,电报技术打破了时间和距离的制约,使得大范围远距离的传播成为可能。电报技术的发明,带来了第三次传播革命,使得千里之外的信息瞬息可至,不仅大大增加了信息的传播速度,信息的数量也急速增加,更多的人也能够更好地获得信息。
第四,互联网技术打破了为精英所控制的大众传播限制,使得、及时、互动的自媒体传播成为可能。发轫于1989年的万维网,带来了第四次传播革命,借助于互联网技术,人人都可能成为自媒体,人人都可以拥有麦克风,一方面打破了信息由精英控制的局面,在很大程度上赋予普通人传播信息的权力;另一方面,由于社交媒体等的推从,信息数量极速增加,根据ZDNET的数据显示,2013年中国产生的数据总量超过0.8ZB,2倍于2012年,相当于2009年全球的数据总量。
2、三大成因汇成大数据时代
首先,摩尔定律使得人类保存数据的能力大大增强。摩尔定律是由英特尔创始人之一戈登·摩尔于1965年提出来的。其内容为:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。在摩尔定律的推动下,价格以更快的速度下降,即当存储器的性能提高的同时,大约每9个月存储容量的价格就下降一半。这一方面使得人们可以有更大、更快的数据保存能力,另一方面使得人们能够承担起保存数据的成本。根据相关数据显示,1990年到2013年,计算成本平均每年下滑33%,1MM的晶体管从527美元下降到5美分;计算成本平均每年下滑38%,1G的存储成本从569美元下滑到2美分;带宽成本平均每年下滑27%,1000M的带宽成本从1245美元下滑到16美元。
其次,社交媒体的出现使得人类生产数据的能力增强。Facebook、TWITTER、新浪微博、微信等社交类媒体使得每个用户都可以发表自己的言论,并以其及时、互动实现传播效应最大化,使得人们生产数据的能力大大增加。例如,Facebook的用户每分钟分享的内容高达246万条,Youtube每分钟用户上传72小时的视频,Twitter用户每分钟发布27.7万条信息。
第三,数据挖掘能力使得人类使用数据的能力大大增强。目前,主流的相关技术主要有MapReduce和Hadoop为代表的非关系数据分析技术。
3、政府数据公开力度加快
首先,国际信息公开已出具规模。美国等西方发达国家大力推进数据开放运动,并于2011年9月20日,美国等八个国家在纽约发起“开放政府联盟”,以向本国社会开放更多的信息。目前,该联盟已经有50多个会员,30多个国家建立了公共数据的开放网站。2012年3月,奥巴马政府公布“大数据研发计划”,以提高和改进人们从海量、复杂的数据中获取知识的能力,发展收集、储存、保留、管理、分析和共享海量数据所需要的核心技术,大数据成为全世界关注的焦点。例如,在美国的“蓝纽扣”计划中,用户可以使用“蓝纽扣”获取个人健康信息,以便管理其健康、经济状况,并与信息提供方交换信息。目前,已有超过1.5亿的美国人能够从健康服务企业、医药实验室、零售药房供应商与州免疫信息数据库获得他们所需的个人健康数据。
其次,我国也在加快数据开放步伐。国家统计局推出了国家数据开放工程,广东、上海、北京等地都在加快数据开发进程,但是和国外发达国家相比,开放程度仍然极低。
二、大数据面面观
当前,大数据正处于快速发展期,每个人对于大数据都有不同的认识,那么什么是大数据?其基本特征又是什么呢?这就需要我们从多个维度来理解和认识大数据。
1、何为大数据?
所谓大数据,是指以服务于决策为目的,需要新型数据处理模式才能对其内容进行采集、存储、管理和分析的海量、高增长率和多样化的信息资本。认真分析大数据,其本质体现在如下五个方面。首先,数据量大。相对于传统的抽样调查的数据,大数据无疑是巨大,尤其是依靠传统的计算手段难以有效计算。其次,服务于决策。大数据的主要目的是服务于各类决策,能够帮助各类组织和个人大幅度提升决策能力。第三,需要新处理模式。由于大数据数量大且是非结构化数据很多,现有的处理模式不能有效处理大数据,需要新处理模式。第四,信息资本。大数据是一种信息资本,而不仅仅是一堆数据和成本,所谓信息资本是指其能够为政府和企业带来未来经济利益的信息资源。更是和土地、资本、人才等一样的新生产要素。第五,更为复杂。大数据比海量数据更为复杂,海量数据包括结构化和半结构化的交易数据,而大数据除此以外还包括非结构化数据和交互数据。
2、大数据的特点
大数据在量度、频度、速度、维度和温度等五个方面具有显著的特点,具体如下。
首先,在量度方面,具有海量性特点,即大数据规模巨大,当前通常指10TB规模以上的数据量,而且随着数据的迅猛增加,大数据的量级还会进一步增加。
其次,在频度方面,具有高频率的特点,即发生的频率很高,重点在于用户参与与互动而产生的数据。在这方面,传统媒体的发行用户数据的价值就很小,关键在于其发行用户非在线,基本上一年才更新一次。
第三,在速度方面,具有实时性的特点,即大数据能够实时反应。例如,在GOOGLE搜索框输入一个关键词,能够瞬间呈现,一旦其反应速度稍有不及,就会有大量的用户流失。
第四,在维度方面,具有全样本、多维度、非结构化的特点,即大数据是全体样本的数据,而不是抽样的数据;大数据是多个维度的数据,而不是单个维度的数据;大数据既有惯常的结构化的数据也有音频、视频等非结构化的数据,而不是仅仅的结构化数据。
第五,在温度方面,具有在线性特点,即大数据是永远在线的,能够随时被调用的,这就要求必须基于用户数量巨大的互联网平台;这些平台记录了用户的行为、情感、思想、爱好与需求,能够科学地分析用户的需求。
此外,可以按照成产的主体不同,把大数据分为商务过程数据(由传统的信息系统产生)、环境状态的数据(由传感器产生)、社会行为的数据(由社交媒体产生)、物理实体的数据(由数字化制造产生)四种类型。当然也可以按照归属主体分为政府数据和企业数据,其中政府数据又分为民意数据、业务数据和环境数据。
3、大数据蕴含着新思想和新思维
在大数据出现之前的小数据时代,我们只能通过抽样调查的方式来回答“为什么”,即找出“因果关系”,找出事情的前因后果,即使有进行的相关关系研究,重点也是研究“因果关系”。
在大数据时代,大数据大大拓展了研究范围,在而大数据则能通过全样本的方式来回答“是什么”,即发现相关关系,这能够帮助我们更好地地认识和了解世界。因此,大数据既能处理“因果关系”又能处理“相关关系”,即不仅能够回答“为什么”又能回答“是什么”。
典型的相关关系而非因果关系的案例主要有:沃尔玛啤酒与尿布的混搭;鲨鱼对人类的攻击次数和冰淇淋的销量是正相关的;儿童的蛀牙数量与他们的词汇量是正相关的;在美国,自2004年以来,“体重增加”与“房屋出租”的相关性达到90%。
4、大数据分析优势显著
首先,大数据能够实现分析的高度智能化。当前,我们已经进入智能经济时代,而大数据能够帮助我们实现信息智能化,即能利用有效的工具对数据进行有效的挖掘和专业化处理,进而通过“加工”实现数据的“增值”,进而实现盈利。大数据的优势在于:一方面实现信息收集和分析的智能化,另一方面实现数据与用户需求的有效匹配。大数据分析的4个关键能力分别为智能预测、高并发处理、统计分析和智能推荐等。此外,大数据分析系统一般可以分为建模层、集成层、存储层、处理层、可视化层和数据发布层等6个层次。
其次,及时、迅速。大数据分析改变之前的市场调研和数据分析相对滞后的模式和方式,能够及时、迅速地进行分析。传统的市场调研和数据分析一般都需要半年甚至更长的时间,例如国家人口普查甚至需要一年以上的时间,而基于互联网的大数据分析则能够快速呈现结果。
第三,成本相对较低。传统的市场调研方法,由于需要使用大量的人力物力,耗资巨大,而大数据由于可以大量使用技术手段,其成本相应较低。
第四,更为准确。传统的数据分析由于很难准确调研用户的行为习惯,一般来说,难以有效精准,而大数据分析则能够有效挖掘用户的真实想法和习惯,则其结果也更为准确。
5、大数据实施的关键
首先,数据的可获得度。目前在国内,大数据的发展严重受制于政府信息的公开性不够,很多数据难以获得,导致难以实现真正的大数据挖掘和分析。
其次,模型建构。模型的科学性直接决定着数据分析的质量,这就要求有高超的建模水平。
第三,观点提炼。为决策提供依据的基于数据挖掘的独到、高质量的观点,高度依赖于高质量的数据解释,这就体现了行业专家的价值。不同的专家对于同一个数据往往会给出截然不同的结论,在房地产市场,任志强、谢国忠都能拿到同样质量的数据,但是其结果却有天壤之别。
6、从数据运营到运营数据
首先,要清楚用大数据做什么?主要解决如下问题:要解决何问题?谁的问题?你能解决这个问题吗?在当下能解决吗?可以用数据解决吗?
其次,用框架做决策。一是确定问题,从解决问题的角度收集数据;二是整理数据,放入数据框架内;三是看框架与决策的关系;四是根据决策行动;五是检查行动是否满足目的。
第三,大数据如何做:混、通、晒、存、管、用。一是“混”,即数据部要和业务部的混在一起,混在一起是开展大数据的前提;二是“通”,即带着业务问题看数据或者带着数据来看业务员。业务问题和数据问题之间的“通”;部门数据和部门数据之间的交叉。通的关键是从事业务问题的和从事数据问题的能够具有相同的话语体系,但是现在无论在传媒业还是在其他行业,多采取的不是同一套话语体系,这就必然导致难以实现大数据与产业的有机融合;三是“晒”,即在获取、使用、分享、协同、连接、组合之上让自己变得超级简单和便捷。为了更好地“晒”数据,一方面需要建立起科学合理的分析框架,另一方面需要善于运用可视化工具,实现分析结果的可视化。四是“存”。必须清楚的是,收集数据不是目的,让收集到的数据如何产生价值才是目的。任何公司都没有财力和能力收集全部的数据,这就要求首先清楚要解决的问题是什么,唯有如此,才能够实现更高的投入产出比。五是“管”。即学会用数据产品来解决获取及使用数据的问题。六是“用”,即数据的分裂和重组,都能做到颠覆性创新。例如,我们一般把性别分为男和女,而阿里巴巴为了更好地描述用户,则把用户的性别分为十几类。
三、大数据时代下的智能传播
在移动互联和大数据时代下,用户的需求更为个性化和定制化,这就要求充分利用大数据技术,来实现智能传播。
1、用户与用户需求巨变
首先,互联网尤其是移动互联用户成为主流。根据中国互联网络信息中心发布的《第34次中国互联网络发展状况统计报告》显示,截至2014年6月30日,中国网民规模达到6.32亿,互联网普及率为46.9%;2014年上半年,网民人均周上网时长达25.9个小时;手机网民规模为5.27亿,随着4G的大规模推广和应用,未来的手机网民规模必将迅猛增加。得益于动辄几亿的庞大用户规模,互联网媒体高速增长。2013年,互联网广告收入高达1100亿元,仅比居于首位的电视广告收入少1.1亿元,2014年会铁定超过电视业而成为我国第一大广告行业,甚至有可能超过电视和报纸的广告收入之和;仅腾讯公司一家,其2013年的销售收入就高达604.37亿元,净利润170.63亿元,是2013年我国整体报业净利润的近2倍。
其次,用户的需求越来越个性化、定制化、精准化。在传统媒体时代,信息相对稀缺,并且由于技术的限制,用户只能接受统一的、标准化的信息,但是这种信息传播方式远远不能满足用户的实际需求。而在互联网时代,由于互联网技术的快速发展,互联网媒体能够利用大数据技术更好地分析用户的潜在需求,也使得用户的信息需求越来越个性化和定制化。例如,今日头条就在致力于满足用户个性化、定制化的信息需求。
2、传统传播、互联网传播与智能传播比较
我们可以从信息丰富程度、传播模式、信息公开度、及时性、商业模式等方面对进行比较分析。
首先,在信息丰富程度方面。传统传播适应的时代为信息稀缺时代,在该时代信息相对稀缺,无论是报纸、杂志,广播还是电视,只要内容做得好,就能够吸引用户;互联网传播适应的时代为信息丰裕时代,在该时代信息相对丰富,以门户网站为代表的PC互联网媒体,单纯依靠内容已经难以赚取真金白银;智能传播适应的是信息过载时代,在该时代信息过多过滥,过载的信息带来极大的信息噪音,单纯的内容已经难以吸引到用户,这就需要提供针对每个用户的个性化、定制化的信息。
其次,在传播模式方面。传统传播是大众式的传播,即一点对多点、标准化的传播;互联网传播则是多点对多点、全立体的、链式的、病毒式的传播方式;智能传播则是多点对一点式的传播方式,即多个信息源来对应一个用户。
第三,在信息公开度方面。传统传播的信息公开度较低,是精英式的传播;互联网传播则信息公开度较高,实现了信息的高度公开和透明,也在很大程度上打破了信息的不对称性;智能传播则实现了传播者和用户两端的高度公开,实现了信息的对称和透明。
第四,在及时性和互动性方面。传统传播一般滞后于信息,及时性不够,互动性更为缺乏;互联网传播较好地解决了及时性,互动性也有了很大程度的改善;智能传播则在信息和用户两端都实现了及时性和互动性。
第五,在商业模式方面。传统媒体的商业模式为“两次销售”,即第一次通过发行把传媒产品售卖给用户,进而获得传播功能,第二次再把传播功能售卖给广告主;互联网的商业模式为“免费+收费”的商业模式,即先通过免费的信息和服务来吸引巨量的用户,然后再通过增值业务向某些用户或者第三方收费,正可谓“羊毛出在猪身上,让狗来买单”;智能传播的商业模式则在互联网的商业模式上,进一步实现智能信息直接收费。
具体比较见下表。
传统传播 互联网传播 智能传播 信息丰富程度 稀缺 丰裕 过载 传播模式 一点多多点、大众式传播 多点对多点、链式、全立体、病毒式传播 多点对一点,精准式传播 信息公开度 封闭 透明 高度透明 及时性、互动性 滞后 及时性、互动性强 高度的及时性与互动性 商业模式 二次销售 免费+收费 混合模式
3、智能传播的核心——基于大数据的智能信息匹配4655465
首先,打造巨型的云信息服务平台,在该平台上,云集着各式各样的信息,既有文字的,又有音频和视频的,并能实现信息的分类筛选、摘编和深度加工。
其次,打造大型的大数据平台,在该平台上能够通过数据挖掘和分析等方式,实现对读者和受众个性化需求的准确定位和把握。[1]
第三,能够通过技术手段低成本地实现信息和受众个性化、定制化的需求之间实现智能化匹配,并能通过各种支付手段,实现智能化信息的收费。目前,已经形成了一些巨型的信息平台,如google、facebook、亚马逊、百度、新浪、腾讯等,也出现了搜索、筛选、推荐等新技术手段,利用技术手段实现精准信息和读者需求的智能匹配进而实现信息的收费将仅是个时间问题。例如,亚马逊通过自己研发的被业界称之为“鬼打墙式的推荐”的精准推荐系统每秒卖出的商品达72.9件,这种精准推荐系统就是跟踪客户的所有消费习惯,不断进行优化。Google和百度利用搜索和筛选手段在一定程度上实现了读者的主动信息需求,而亚马逊等利用推荐手段也在一定程度了满足了读者的被动信息需求,而基于巨型平台的社会引擎将能够实现精准信息和读者需求的智能匹配。
目前,在国内,互联网三巨头“BAT”已经在大数据和智能传播方面打下了坚实的基础,这也给他们带来了丰厚的收入。例如,阿里巴巴围绕大数据打造了巨型的信息系统,其广告收入从2012年的98.04亿元高速增长到2014年的297.29亿元。在例如,腾讯2014年的广告收入有可能超过80亿元。
4、传媒业大数据实践误区
当前,传媒业虽然也高度重视大数据,但是在大数据实践中仍存在多种误区。
首先,依然秉持“内容为王”理念。正如上文所述,智能传播的关键是智能信息匹配平台,单纯的内容已经难以为继,但是很多传统媒体依然单纯从内容上发力。[2]
其次,认为大数据仅仅是工具。很多传统媒体仅仅把大数据当成工具和手段,而没有把大数据当成传媒业的底层架构和标配,这必然导致其在发展大数据的过程中变形。
第三,误把数字化当成数据化。很多传统媒体认为只要把之前的用户资料和内容资源从此前的纸质版转为数字版就实现了数据化,其实这仅仅是数据化的最浅层工作。
第四,误把新闻可视化当成数据化。很多传统媒体仅仅把数据化当成数据新闻或者可视化新闻,其实数据化是整个系统的数据化,单纯的数据新闻或者可视化新闻都远远解决不了实际问题。
四、智能传播的盈利模式
首先,信息服务收费。由于信息智能匹配能够给用户节省大量的时间,用户必然会对其收到的个性化、定制化信息服务付费,而可以预测,这一块将会有上千亿元的市场规模。
其次,广告。未来,机遇大数据的广告能够实现精准广告投放,则这一块也会有很大的市场。
第三,电子商务。基于大数据的电子商务,将成为智能信息匹配平台的重要组成部分。
第四,舆情增值服务收入。媒体可以给政府、企业各类组织提供基于大数据的舆情服务,进而获得收入。
第五,网络行政服务。智能传播平台能够为当地政府提供高效的、标准化的网络行政业务,其市场规模也会很大。
文章原载于《新闻爱好者》2015年第1期