科学研究的第四范式及其演进版“开放科学”
《竞争情报》2022年第12期刊登了一篇名为《全球科研范式数字化转型趋势研究》的文章,探讨了数字化转型对科研范式的影响以及世界上主要国家采取的因应之策,选题的切入点很巧妙,文章探讨的也很充分,读完之后深受启发。
1. 范式及其发展
范式是一个来自于科技史的概念,由T.S.库恩提出。指的是科学家共同遵守的一套理念和实操体系。科学研究范式则是关于研究的一套被学术共同体认可并接受的研究规范。基于这概念,2007年Jim Gray将科学研究的范式分为经验科学、理论科学、计算科学和数据密集型科学,并指出当时正处于第四种范式的起步阶段。本文作者认为当前第四范式有了新的发展,即进入开放科学的新范式阶段。
2. 第四范式是什么
随着信息技术(计算机科学和互联网)向社会生产生活的各个层面渗透的日益加剧,数据爆炸成为时代最显著的标识。这既来自于人类在互联网上活动而自发或被动产生的各类内容数据,也来自于被各种高精尖设备武装的科研设备产生的庞大数据。这一现状导致了“数据密集型科研范式(第四范式)”出现,和向开放科学范式的渐进演进。
传统科学的研究模式是“现有一个研究假设,然后通过实证数据来证实/证伪它”,在大数据时代这一模式变成了“现有海量数据,需要从其中发现一些模式和结论”,因此“数据密集型科学推动科学研究由传统的假设驱动转向对科学数据的探索。”——从验证和判断,变成了探索和发现。
作者认为,“数据密集型科学(第四范式)具有四个特征:一是研究对象由实验对象转为数据;二是科学研究由假设驱动转为数据驱动,实现科研范式的数字化转型;三是更加重视科学数据的共享;四是更注重数据间的相关性,快速地从数据中挖掘其逻辑性和关联性。”
3. 第四范式的新发展
在大数据时代,这一范式进一步演化为“开放科学”的版本,呈现出“以大数据为基础,深度学习、人在回路、群智开放、跨界融合等新特征”。落到技术层面则是,形成了“围绕人工智能技术的科学问题形成数据聚合、工具集成与人工协同的科研体系”,“研究对象拓展到“人-机-物”融合的三元空间,“更侧重人、机器及数据之间的交互”,研究内容层面“强调人脑(人的决策机制)与计算机(数据分析)的融合”,从而“体现出数据与智能有机融合”的新特征。
在这一背景下,科学研究不再局限某一个研究机构或团体,而成为全球科学家共同体的共同责任和使命。科学日益开放化,科研成果开放获取,研究数据开放共享,研究过程开放协作,形成全球共同参与的公民科学。据此,美国和欧洲主要国家也都制定了数据开放和研究开放的政策,建立知识开放平台(这是这篇文章重墨所在,感兴趣的读者不要错过)。
4. 总结
这篇文章以“数字化转型”为切入点,以研究范式的演进为线索,并以“数据”这一最核心的研究资源为载体探讨了全球科研体系在现在这个时代的共同趋势和特征(即第四范式的新发展),非常具有启发性。
近20年来,数据和数据处理工具技术都有了突飞猛进乃至革命性的变迁,对于竞争情报研究的影响也是不言而喻的。在开放的时代更加注重开源情报和开源技术的挖掘和应用,更加努力提升研究者自身的研究品味和使用工具的能力,方能更好地做好情报研究这件事。