2024年6月18日上午,文澜财税论坛(第94期)在文泉北603会议室顺利举行。本次论坛邀请了北京大学刘冲副教授做题为“文本分析在经济学中的应用探索与展望”的学术报告。讲座由js3845金沙线路田彬彬教授主持,学院部分教师及研究生共同参与了本次学术交流活动。
首先,刘冲老师提出一个问题:经济学是怎么看待这个世界的?他解释道,经济学不是故事会,需要通过各类指标来对世界进行度量。刘冲老师在介绍了经济发展的度量指标后,提出了文本这一新的海量数据源。他指出,社交媒体产生了大量的文本信息,以及大量电子化工作的推动,使得非结构化的文本数据逐渐可得。
随后,刘冲老师为我们介绍了文本量化研究的具体内容。他提出,文本的量化主要依靠机器,通过计算机将原始文本进行收集、数据库化,再将其进行预处理,而后可以通过不同的数据分析方法,将文本转化成所需要的文本形式。他还向我们介绍了量化文本的常见方式,主要是基于词袋法的文本特征矩阵,它是将文本数据转化为数值表示,其中每个单词或词组的出现次数或频率构成矩阵的行或列。
接着,刘冲老师详细阐述了如何衡量经济政策的不确定性这一问题。为了破解词典法在衡量政策不确定性上的缺陷,刘冲老师为我们引入了词嵌入这一方法。词嵌入可以算出文本中所有词和情感关键词的关系,也可以得到每一个词准确的情感得分。根据以上分析,刘冲老师得出结论:文本提供了丰富的数据源,但应用场景有其适用范围;大数据时代需要做到不迷信技术,也不要被数据蒙骗。
最后,田彬彬教授对本次论坛进行了简要总结,并再次感谢刘冲老师带来的精彩讲座。至此,本次学术论坛顺利结束,拓宽了同学们对文本数据的认识,加深了同学们对经济学的理解,进一步浓厚了学院的学术氛围。(通讯员 余朵)