“大数据”对博物馆的启示

  大数据是当下各界热议的话题。随着个人电脑、智能手机和掌上智能设备的普及,互联网、移动网络、社交媒体、各种传感器每时每刻都会产生海量的数据,一个大规模产生、分享、应用数据的时代正在开启。在大数据时代,新技术的应用带来了思想观念的变化,也对博物馆的创新与发展带来启示。

  博物馆的大数据

  一、博物馆的基础数据储备

  随着藏品信息化工程的不断深入与完善,博物馆在利用藏品管理软件完成藏品信息数据库建立的基础上,已经拥有了大量的数据资源。博物馆的藏品信息不仅包括对藏品名称、时代、地点、质地、外形尺寸、流传经过、所属关系、用途、保存情况、评价、征集者和征集时间等文字类描述,还包括图片、视频、平面扫描、三位立体扫描等影像类信息。藏品是建立博物馆的必要条件,是开展陈列宣传、科学研究等各项业务的物质基础,因此藏品信息是博物馆最基础的数据。同时,在历次陈列展览和各种研究成果中所形成的文本、图片、音频和视频等数据也是博物馆基础数据的重要组成部分。博物馆的这些基础数据数量庞大,而且随着藏品和展览数量的增加以及新研究成果的产生,数据量也将不断增长。

  二、观众行为形成的数据

  观众是博物馆的服务对象,也是博物馆赖以生存的社会基础,博物馆要更好地为观众服务,必须调查了解观众,研究观众的需求。因此,观众数据是博物馆最重要的数据之一。博物馆的年观众数量、每个展览的观众数量、参与活动的观众数量、不同时间段的观众数量,观众的年龄层、来源、类型、消费情况以及观众留言等,这类观众数据已普遍被通过各种途径纳入博物馆的日常收集范围中。在这些数据中,除了观众留言是非结构化数据外,其余都是结构化数据。在当下非结构化数据占总数据90%以上的大数据时代,要研究观众的心理和行为,这些数据是远远不够的。目前,国内已有不少博物馆建立了网站、数字化博物馆、智能导览系统等,这些集知识性、互动性、娱乐性于一体的新媒体平台,增进了博物馆与观众之间的互动与交流,同时也产生了数量庞大且能有效反映观众行为的非结构化数据。观众在博物馆参与了什么活动?对哪些展品更有兴趣,甚至进行了点评?在博物馆商店购买了什么纪念品?在博物馆网站上浏览什么页面……通过收集这些数据使博物馆的数据类型更加多样化。

  三、社交网络为博物馆带来的数据

  根据最近两次中国互联网络发展状况统计报告显示,博客、微博、社交网站在中国网民的网络使用率中位列前茅。随着社交网络的蓬勃发展,近几年许多博物馆相继开通了官方博客、微博、微信等,借助互联网的社交平台积极与公众进行互动与交流。自2011年——中国博物馆界“微博元年”以来,已有数百家博物馆在新浪开通了微博,博物馆的微博粉丝数量也逐日攀升。博物馆在利用微博平台策划线上主题活动、宣传博物馆文化的同时,也收获了大量与公众互动交流的非结构化数据。这些非结构化数据虽然数量庞大、价值密度低,但数据的真实性和利用率却是高于博物馆通过抽样调查等传统方式所收集的数据。对于尚未开通官方微博、微信的博物馆而言,从第三方的社交网络平台上获取相关数据也不失为一种经济有效的好方法。例如利用微博、论坛和一些本地生活服务类点评网站的搜索功能,搜索具体的博物馆名称,可以获得不少真实而有价值的观众数据。

  大数据对博物馆的启示

  大数据时代的到来改变了传统的数据收集、存储、分析和利用方式,由此而引发的一系列变革,将改变人类生活的各个领域。作为为公众提供知识、教育和欣赏的社会公共文化教育机构,博物馆不可避免地会受到数据应用技术革新的影响。如何从各种类型的数据中,快速获得有价值的信息并加以利用,从而为公众提供更优质的服务,是博物馆面临的新课题和新的发展机遇。

  一、为学术研究提供数据支持

  大数据一直在科学研究领域发挥着强大的作用。应用大数据技术,对海量的藏品数据和以往的研究数据进行分析和挖掘,大量非结构化数据的补充,将会给博物馆的藏品管理和研究以及其他专业研究带来新的发现。此外,来自互联网、移动设备和智能系统的大数据使得公众参与和跨领域合作成为可能性,更广泛的参与性也将为博物馆的学术研究带来新的资源和启示,从而提升博物馆的学术研究水平,推动博物馆各项业务工作的开展。

  二、为展览策划提供新素材

  展览是博物馆提供社会服务的一个重要方面。2011年国家一级博物馆运行评估报告中指出,全国83家一级博物馆的原创性临时展览存在选题雷同、形式缺少创意、数量不足的情况。博物馆原创性展览所面临的现状不得不引起我们的重视。博物馆不妨尝试应用大数据技术,在对海量数据的分析中,挖掘出既能体现博物馆文化内涵,又符合公众关注点的展览主题、适合不同观众特点的体验方式等素材,推出受观众欢迎的原创性展览,进而用展览来带动博物馆的学术成果、文化产品和社会教育活动的举办。

  三、为观众提供个性化的服务

  主动适应个性化时代观众个性化的需求,是时代对博物馆的要求。通过博物馆网站、官方微博、各种智能系统所产生的大量与观众相关的非结构化数据,是实现博物馆为观众提供个性化服务的数据资源。基于对观众数据的分析,大数据技术可以帮助博物馆开展跟踪服务、精准服务、知识关联服务和宣传推广服务,针对不同的观众提供更有针对性的服务。事实上,博物馆缺少的并不是数据,而是数据分析的手段。大数据的意义也不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业化处理。让沉寂的数据活起来,从纷繁凌乱的数据中挖掘观众的行为习惯和喜好,预测观众未来的需求,进而对服务进行有针对性的调整和优化,才是大数据对博物馆服务的价值之所在。

  大数据在博物馆应用中

  可能产生的问题

  一、成本问题

  大数据的应用必须有大技术来支撑:海量数据的采集和存储能力,高速的数据处理和分析能力,系统的扩展和集成能力。要完成对海量数据高效地采集、存储、处理、挖掘和利用,不仅需要强大的硬件和软件支持,而且对人力投入和操作人员的技术水平都要有相当高的要求。对于绝大多数依靠国家财政支持的公益性博物馆来说,在资金投入上肯定是有限的,不可能与资金实力雄厚的大公司相匹敌,想要独立开展大数据项目有相当大的难度,不妨采取与第三方专业技术公司合作的方式,推动博物馆的大数据模式,通过释放博物馆的大数据潜力,提升博物馆的综合实力。

  二、人才培养问题

  如何从海量数据中发现价值,如何寻找隐藏在大数据中的模式、趋势和相关性,揭示其中的事物现象和发展规律,都需要我们拥有更好的数据洞察力。由于大数据的应用是技术难度极高的集成应用,涉及多个学科领域,因此,在大数据时代,数据管理人才成为数据密集型科研环境下的稀缺人才。博物馆无论是独立运行大数据项目,还是与第三方合作开发,都不能缺少一支具备较强博物馆专业知识同时又懂得数据管理的人才队伍。只有通过相关人才队伍的建立,才能保证博物馆大数据项目的顺利开展。

  三、安全和隐私问题

  数据安全和数据隐私问题是大数据时代不可回避的问题。数据让我们面向更开放社会的同时,也让我们面临着时刻暴露在“第三只眼”的困境之下。博物馆通过应用大数据技术为公众提供更优质服务的过程中,获取并分析了大量的数据。这些数据有相当一部分必然会涉及公众的个人隐私,如何有效地管理这些数据是博物馆在应用大数据技术时需要谨慎考虑的问题。在互联网时代,关于安全和隐私的数据使用往往通过“告知与许可”的公式化系统达成,而在大数据时代,因为数据的价值很大一部分体现在二级用途上,而收集数据时并未做这种考虑,所以“告知与许可”就不能再起到好的作用了。在目前尚无明确的数据安全和数据隐私方面的规范出台以前,《大数据时代》一书的作者维克托,提出了由数据的使用者成为责任的承担者无疑是当下最合理的解决方式,这就需要博物馆在应用大数据时建立安全的数据收集、保存、利用机制,而博物馆工作人员也应具备更高层次的职业道德和专业素养,在保护公众个人隐私的前提下,为公众提供优质的个性化服务。

  随着大数据热潮的不断升温,先知、先行者既可能率先受益,也可能率先迷失,关键在于能否看清创新方向并找准应用模式。面对大数据时代的来临,关于大数据技术的应用,盲目推崇和不屑一顾都是不明智的态度。目前,我国的大数据技术应用尚在起步阶段,还面临着许多问题和难题,博物馆的数据处理还缺少深入细致的科学研究和可行有效的实践探讨,随着大数据技术在各个行业领域的不断发展与成熟,相信博物馆也将在大数据时代释放巨大的潜能,进一步提升博物馆的整体工作水平,更好地服务于社会,为公众创造更大的价值。

  何为“大数据”

  大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

  随着对大数据研究的逐步深入,业界对大数据的特点有了较为全面和统一的认识。目前,Volume(数量)、Variety(多样性)、Velocity(速度)——大数据的3V特点已成为共识。

  1.Volume——大数据体量巨大。通过各种设备产生的海量数据,其数据规模极为庞大。“过去两年里所产生的数据量占到人类有史以来所积累的数据总量的90%”,因此,数据量将从TB级跃升到PB级,甚至是EB级。海量的数据无疑对数据的存储提出了更高的要求。

  2.Variety——大数据类型繁多。大数据类型的多样性也让数据被分为结构化数据和非结构化数据。结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像、音频和视频信息等等。相对于以往便于存储的结构化数据,大数据中包含的非结构化数据越来越多。据估计,只有5%的数据是结构化的,剩下的95%都是非结构化数据。众多类型的数据无疑给当前数据的处理模式带来了极大的挑战。

  3.Velocity——大数据要求处理速度快。通过各种设备产生的海量数据,其中相当一部分是存在时效性的,过时的数据也就失去了分析的意义,数据只有被快速地使用,才能创造真正的价值。IDC的研究结果表明,2011年创造的信息数量达到1800EB,每年产生的数字信息量还在以60%的速度高速增长,到2020年,全球每年产生的数字信息将达到35ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。

  4.Value——大数据的价值密度低。在Computerworld Australia和存储网络行业协会A/NZ共同举办的信息基础设施推进研讨会上,IDC美国存储方案副总裁Benjamin Woo提出了大数据除Volume、Velocity、Variety外的另一个特点。以视频为例,一部一小时的视频,在连续不间断监控过程中,可能有用的数据仅仅只有一两秒。因此,价值密度的高低与数据总量的大小是成反比的,如何迅速提取有价值的数据是目前大数据汹涌背景下亟待解决的难题。

  5.Veracity——大数据的真实性。在IBM2013大数据新闻发布会上,IBM在大数据的3V特点上又提出一个维度来看大数据,即数据的真实性。“只有真实而准确的数据才能让对数据管控和治理真正有意义。”面对海量数据,如何利用数据融合和先进的数学方法进一步提升数据的质量,从而创造更高价值,考虑的重要维度。

  “大数据”对传统数据理念的变革体现如下:

  1.大数据需要所有数据而非抽样数据

  随着记录、储存和分析数据的技术工具飞跃式地提高,可以处理的数据量已经大大地增加,而且将会越来越多。因此,在大数据时代我们需要的是被分析事物的所有相关数据,而不是少量的数据样本。

  2. 大数据注重相关性而非因果关系

  大数据通过发现两个现象之间存在的相关性创造价值。如果A和B经常一起发生,那么如果B发生了,我们就可以预测A也会发生,至于二者为什么相关可以留待以后慢慢研究。

  3. 大数据包容混杂性而非追求精确性

  大数据时代,可能只有5%的数据是精确性的结构化数据。如果不接受混杂性的数据,剩下95%的非结构化数据都将无法被利用。

  数据本身是资产,这一点已形成共识。如何盘活数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题。
责任编辑:小萌

扫描此二维码,分享到微信

中国文物网版权与免责声明:

一、凡本站中注明“来源:中国文物网”的所有文字、图片和音视频,版权均属中国文物网所有,转载时必须注明“来源:中国文物网”,并附上原文链接。

二、凡来源非中国文物网的新闻(作品)只代表本网传播该信息,并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的,请在见后30日内联系邮箱:chief_editor@wenwuchina.com

相关推荐
新浪收藏 | 出山网 | 中国艺术网 | 书画圈网 | 东方艺术媒体联盟 | 辉煌艺术网 | 大河艺术网 | 中艺网 | 环球文化网 | 文物出版社 | 中国文物保护基金会 | 北京文网
腾讯儒学 | 东方艺林 | 贵州收藏网 | 中国经济网 | 广州博物馆 | 华夏艺术网 | 中华汝瓷网 | 中新网