科普专栏新闻
几百年前的数据还好使吗?
发布时间:2019-06-08 来源:石头科普 浏览:27

    在科学研究中,科学家们往往需要通过进行大量严谨的实验、收集大量的数据,然后对这些数据进行认真的比对分析,才能最终得出结论。这样的工作,可想而知对数据的准确性乃至时效性都会有严格的要求。但是你知道吗?在某些研究中,我们甚至可以对几百年前的数据进行分析,进而帮助我们得出结论!



在太阳乃至天文学的研究中,时间尺度是个非常重要的概念。时间尺度决定了在研究中需要关注什么物理量和物理现象。

而不同的研究对象也对应了不同的时间尺度。

耀斑能量释放过程的时间尺度是秒到分钟



日冕物质抛射穿过日冕的时间尺度是小时到天



黑子的平均生命周期是两周



太阳自转周期大概是一个月



更长期的,太阳活跃程度有11年的周期



我们现在(2019年)正处于第24个太阳周的末尾的太阳平静期。

不过,不同太阳活动周之间太阳的活跃度也有差异。


400年间太阳黑子活动情况


比如著名的Maunder极小期,在16451715年这几十年里,太阳黑子数非常非常低。



这种现象让学者不禁猜测:太阳活动是否存在比11年更长的周期?

在研究太阳的超长周期的时候,当然需要把过去几百年的数据整合起来去分析变化趋势。

问题来了,把几百年前的数据和现在的黑子数据放在一起,这种跨越世纪的数据对比是有意义的吗?结果可信度有多大?

这个问题,登上了Nature Astronomy的封面。



PSNature Astronomy 把官推头像都换成了这张图



长按识别下方二维码查看原文:



这篇文章中提出了导致结果不可信的来源:

1.望远镜不同,观测者不同,可能会导致最终观结果测差异很大。因为科技在发展,我们现在已经可以做到精度为0.5角秒的完全不间断的全日面观测,而几百年前,只有肉眼和光学透镜。毕竟1960之后才有可以用于科研的计算机。

2.使用古老数据的另外一个问题是:同一个观测者的洞察力也是随时间变化的,尤其是在使用肉眼望远镜的年代,随着观测者的衰老,视力观测时长等因素会影响观测结果。

3.人对事件的认知也在发生变化。

4.缺少均匀而连续的观测。这个问题在现代观测中几乎不存在,就像SDO卫星,24小时都能看见太阳,能一直做不间断观测。老数据中会出现由于观测者的缺席等不可抗拒因素造成的数据不连续。

5.对于事件强弱的认证困难。因为老数据中不包含绝对定标。

对此,文章中给出了一个例子:



图左是400年前对于黑子的记录,图右是现在对于黑子的观测。

图左在一幅图上画出了黑子演化的过程,记录标明黑子从多个黑子群合并成一个黑子群。如图右也是黑子群,但是很难说这到底是一个黑子群还是两个黑子群。

这就是问题之一:我们很难定义分多开的两个黑子群算是两个黑子群?白光观测中的多大的黑斑算是一个黑子?黑子中有多少次级结构能算是一个黑子群?

其实这些都是模棱两可的问题,存在很大的主观性。

只要评判标准存在主观性,那么结果唯一性就会受到影响。

虽然当代观测面临这样的定义边界模糊的问题,由于观测设备优秀,观测者多,所以得到的观测结果一致性很高:


a是不同科学家观测的太阳黑子群的数量,图b中一个黑点表示一个观测,连线表示观测的相互印证。


图中可以看出来这400年的观测里,前200年可以相互印证的观测很少,而且大家观测的差异比较大,线图给出的结果比较不统一。从1850年开始,可以相互印证的观测开始明显增多,不同观测者的结果也比较统一。

如果但看后面这一段,并没有很强的周期性,太阳黑子数相对比较稳定。

另外一个角度,数据覆盖率。

连续时间序列分析中,观测时间覆盖率非常重要。观测时间覆盖率越高,结果就越可信。现在的观测可以做到完全连续观测,因为全球都有观测站,而且还有可以持续观测的观测卫星。而老数据的时间覆盖率就很差了

这也是我们需要小心使用老数据的一个重要原因

Nature-Astronomy中这篇文章对于观测的时间覆盖率也做了分析。



可以看出对于位置的记载在1820年之后才出现连续的覆盖率超过20%的观测,在此之前的绝大多数年份有记载的数据覆盖率不超过5%

从这些角度来看待这400年的黑子数据,就可以很直观的看出哪些数据是可信的,哪些数据是不可信的。

这个太阳黑子的例子给科研者提供了一个很好的数据展示典范。很少有科研者能做到这件事,就是告诉大家自己所用的数据里面哪些是更可信的,哪些是值得怀疑的,并在数据上把衡量可信度的指标标记上去。

在实际的科研中,其实经常会遇到类似需要组合数据联合观测的手段,需要把很多观测资料组合起来去解释一个物理现象。这个时候就需要非常小心。

把不同时间不同仪器观测的同一个物理量的时间序列用于分析的时候,要时刻自己明白哪些数据是更可信的,同时在工作总结和文章的时候也有义务让读者了解不同部分数据的可信度。

在自己需要定判定标准的时候,要尽量避免主观成分。

比如定一个阈值来决定白光全日面观测中多大黑斑算一个黑子这个问题。就像定一个阈值来划分问有多根少头发算秃子,多少根头发算乌黑浓密一样(扎心了)。

从这个角度看,用亮度离群值总面积比数黑子数来表征活跃度应该更合适一些。

总之,如果仔细整合、小心求证,那么,即便是几百年前的老数据,也可以在科学研究中大放异彩!


参考资料及图片来源:

www.helioviewer.org

nasa.gov

Wikipedia : solar maximum

CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=969067

Wikipedia : maunder minimum

(责任编辑:张馨文)

(版权说明,转载自:石头科普工作室)