一、信息化时代和人工智能时代的个人信息状况
我们正处于一个信息化的时代。随着全球联系日益紧密,以及人们日益追求快速高效地处理各种问题,在计算机、互联网、交通通讯等各种技术高速发展的情况下,人们生活、工作、学习的各个方面,都快速地创建/发现、传播、存储、研发各种信息,都在参与构建和发展信息化时代。简单说,技术发展,让我们可以将各种认识按照一定的规则编码排序。而信息的快速流通和传播,也促使了虚假或错误信息的流传,最终容易使人处于一种信息虫茧而愈发封闭的境地。
于此同时,我们也开始迈入人工智能时代。由于人工智能技术的限制,目前的人工智能还没有达到通用人工智能的水平。因而,人工智能如ChatGPT-3.5,在回答问题时,通常会胡编乱造一些数据或信息,让使用者陷入人工智能说的好像是对的“幻觉”之中。例如,之前一段时间,在问ChatGPT-3.5,“为何鲁迅和周树人打架?”,她会回答,这是因为两人产生了分歧,如此种种。而在问“爱莲说的作者是谁?”,她会回答说:是杨万里;有时会回答是张爱玲等。不过,这些问题,随着ChatGPT调用的中文数据越来越多之后,这类问题会被纠正,并出现的次数会逐渐减少,但仍然无法排除人工智能产生“幻觉”的可能。因而,在利用人工智能的同时,而不被其“幻觉”所产生的错误信息误导,也是我们需要关注的问题。
二、基于信息得到的查询信息的基本原则
在互联网和手机通讯(包括即将盛行的卫星通讯)行业高速发展的带动下,信息的产生、存储、利用、发现新信息的速度变得更快。但虚假的信心也会因为便捷的流通而快速渗透到人们的生活、学习的各个方面。在加上人工智能技术的待完善所产生的“幻觉”或错误,以及某些人工智能根据用户偏好推送类似信息的推送规则,如何保证自己不被信息海洋淹没或不造成信息虫茧而愈发封闭,使自己得到的信息有偏差甚至完全失实,找到解决现实问题所需的目标信息,对于提高个人的认知和能力,就显得尤为关键和重要。
如果要查找有用的信息,我们要先明白信息流通的基本模式以及信息的基本载体(见我的这篇文章)。基于信息的本质可知,信息是人们对其关于世界和人的认知进行一种编码。而编码准许的基本原则是:(对人或人类而言的)有用性。基于我们对信息本质和流通模式的分析可知:信息作为编码过的认识,其流通遵循创造或发现、存储、流通、利用、产生新的信息,如此循环往复;而信息主要载体主要包括语音、文字、图片、视频、全息影像等等。认识信息的本质、基本流通模式和承载信息的载体之后,可以方便我们更好地、快捷高效地查询到有用的、自己想要的信息。
(一)基于信息编码原则的启示
查找最有价值的信息源和存储点。由于信息是根据有用性来编码,那么,我们在查找信息时,就可以根据需要查找的信息,并定位信息所处于的学科、行业、部门等,并通过对应的学科、行业和部门精准地获取所需的信息。例如,查询一瓶化妆品某个元素的含量(未注明这个成分所含比例),那么,就可以根据产品的编号和这种化妆产品必须遵循的标准来看这个成分含量的基准值,任何夸大或缩小都可以核实。同样,如果要查哲学领域某个教授的文章,那么,就可以根据他所在学校网站的介绍、个人网站、邮箱或专业的哲学类网站如https://philpapers.org/查询,如果需要下载详细信息,可以使用学校购买的外文期刊库来下载或者使用类似于Sci-hub的工具来下载文章。如果要查询企业管理者经营状态或是否是失信人员,可以通过企查查、天眼查、企信宝等工具查询,借此,可以查询到公司基本信息、经营信息、经营风险等等。例如查询“恒大”,就可以查询到其股东“广州市凯隆置业有限公司”成为“被执行人”,而该公司法定代表人韩雪则被“限制高端消费”(查询时间:2024年1月31日)。
(二)基于信息流通模式的启示
1.就信息源而言,我们需要找到权威可靠的信息源2.就信息流通的存储而言,需要根据存储方式的不同而改变查询方式
3.就信息的利用而言,查询信息时,我们需要首先定位该信息最权威的机构
4.信息的研发、利用要遵循科学的原则
信息的流通,最重要的是新信息的产生。由于人人都可以成为信息产生的源头,各种信息的传播似乎都有自己的合理理由和存在方式,因而,在查询信息时,就需要辨别哪些信息是更有价值或更可靠。就信息源而言,我们需要明晰,通常针对某个问题,我们需要找到这个领域的专家或大牛。为避免某个专家的偏见带来的信息误差,有必要多参考同级别专家的观点和意见,最终自己形成自己的观点。
不同的信息,会以不同的载体存储。例如,图片会以图书、胶卷、电子化图片的形式存储等,而视频则可以光碟、U盘、移动硬盘、NAS等存储。因信息存储方式不同,查询信息的途径也会不同。
当然,就信息存储而言,目前人们通常习惯将信息电子化。因而,查询信息时,首先要会查询已经电子化的信息。就此,我们需要善于利用以Google为代表的探索引擎、以wiley、谷歌学术、PubMed、Web of Science、知网等为代表的学术文章收集、统计工具,以Nature、Science等杂志为代表的专业期刊、以Github、Stack Overflow、ResearchGate等为代表的专业社区等,以及以Coursera、edX为代表的在线教育平台。与此同时,要利用诸如ChatGPT-4、Bard为代表的文本生成式的人工智能和以elicit、scinapse、semanticscholar、chatpdf等为代表的人工智能文献分析工具等。当然,在使用人工智能的服务时,需要格外小心,尽量要审核信息的真伪,保证信息的有效性和有价值。可以参考Snopes或factcheck或根据某个行业的标准、词典、专家意见等来核实。
对于许多还没有电子化的信息,我们需要更深入的探寻。例如,对于历史上的图片、文字等信息,如果互联网上并没有收录或发现,那么,通常可以通过以下方法来实现:访问公共图书馆或档案馆或者大学、其他研究机构的特殊馆藏,或者访问该图片所涉及的历史学家或研究者,查询该图片所在地方的社会历史地方资料档案馆,或者访问数字化的博物馆的数字收藏,或者通过查询相关书籍来查询。
不同的人或机构对信息审核、选择、使用、存储的机制不同。通常,越是专业化的、大型的机构,其挑选信息,约会遵循严格的标准,保证获取的信息是精准、可靠而有效的。因而,查询信息时,直接在这些领域的专家或专业机构,会省去我们走很多弯路。
例如,对于人工智能的研发,通常我们可以在大型的公司如Google、亚马逊、微软等得知人工智能领域最新、最先进的研发信息,当然,也可以在诸如斯坦福大学、MIT等大学或研究机构得知最可靠的信息。查询国内的人工智能研发情况,思路大体如此。
信息的研发和利用,虽然不是信息查询的步骤,但是却会影响下次信息查询的效果。因而,有必要强调,在研发、利用信息时,要遵循科学研究的精神和原则,尽量符合事实地和语境地使用信息、产生新的信息。
三、总结
综述所述,查询信息的关键在于,在明晰信息的本质和流通模式、规律之后,我们首先要定位信息所在的领域,并找到该领域最权威、核心的信息源。这源泉包括而不限于专家、教授、研究者或大型公司或研究机构、学术机构等等。然后,充分利用电子化信息探索工具和非信息化查询途径,我们便可以很快找到高质量的、可靠、有效的目标信息。
后续,我将分门别类地列举一些我收集、分析的信息收集、存储、利用的工具。敬请期待。